Веб грабер с распределенной нагрузкой на сервер
Евгений18 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
09.06.2008
Интересует грабер тегов по списку сайтов с паузами при сборе, с использованием подстановки прокси при сборе.
Данные парсяться из HTML кода. Требуется приложение под freebsd + apache (php, cgi, python).
Помимо сбора данных о сайта требуется осуществлять выборки из собранных данных в MySQL для повторного прохода и сбора ссылок на предмет наличия страниц, содержащих определенные слова и извлечения требуемых данных.
В момент сбора должны использоваться неполная нагрузка на сервер, т.к. на нем работают другие сайты.