Парсер текста сайтов и поисковой выдачи яндекса

Сергей16 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
09.03.2009

Необходим парсер, который будет пробегать по списку сайтов (страниц), которые буду загружены в формате http://*

Далее парсер находит на странице предложение с кол-вом слов ни менее 4-х. Берет это предложение от предыдущей точки, до следующее, не включая названные и вставляет в поисковую страницу яндекса в формате "Предложение тра та та все дела".

Далее ищем. Смотрим выдачу. Испытуемый сайт должен стоять на первом месте, если место другое или сайт вообще отсутствует, то парсер дает ответ - нету, если сайт (страница) есть на первом месте, то пишет - ОКай.

Возможность задачи интервала парсинга - короче чтобы капчу не вводить.

Очень важный момент, парсер должен случайным образом на испытуемом сайте открывать еще две внутренние ссылки, так же выбирать текст и проверять его. Если все 3 страницы ок, то пишет глобальнй О К