Бот для проверки page rank
необходим скрит на перле который собирает списки с доменов с серверов и проверяет их пр
на входе он получает из текстового файла тройки вида
domain.com;login;pass
domain.com1;login1;pass1
domain.com1;login1;pass1
полученые строки разбиваются на 3 переменные domain login pass, после чего скрипт авторизуется на домене domain.com через базовую авторизацию с логином login и паролем pass, скачивает cvs файл с содержимым
,ДОМЕН,ИП ПРИНАДЛЕЖАЩИЙ ДОМЕНУ,penang,,,,,,,,,root,ИМЯ СЕРВЕРА ГДЕ ВИСИТ ДОМЕН,x,,1536000,,,,personal,,,,,,,06 Aug 31 13:54,1157003675,
получает оттуда домены, проверяет у них page rank с www и без него,
проверяет ип домена(host domen), сравнивает его с тем что указан в cvs,
после чего пишет в текстовики следующую инфу:
good.txt - тройку domain.com;login;pass если базовая авторизация была успешна
bad.txt - тройку domain.com;login;pass если базовая авторизация была неудачна
socket.txt - тройку domain.com;login;pass если истек таймаут соеденения
checked.txt - все обработаные тройки(для того чтобы была возможность продолжения работы скрипта без повторной проверки уже отработаных троек)
domain.com.txt - обработаные домены из скачаного cvs файла в следующем формате
ДОМЕН[TAB]ИМЯ СЕРВЕРА ГДЕ ВИСИТ ДОМЕН[TAB]МАКСИМАЛЬНЫЙ PAGE RANK[TAB]ИП ДОМЕНА УКАЗАНЫЕ В СКАЧАНОЙ CVS[TAB]ИП ПОЛУЧЕНЫЙ ЧЕРЕЗ КОМАНДУ HOST[TAB]1 ИЛИ 0 В ЗАВИСИМОСТИ ОТ ТОГО СОВПАЛИ РЕАЛЬНЫЙ ИП И ИП ИЗ CVS ИЛИ НЕТ[TAB]
checked.txt должен использоваться для того чтобы была возможность продолжения работы прерваного скрипта, т.е перед тем как начать обрабатывать тройку скрипт должен проверить ее наличие в checked.txt, и если она там есть - перейти к следующей.
скрипт должен быть многопоточным, можно использовать и threads и fork, главное чтобы работало.