Парсинг сайта

Александр19 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
13.07.2009

Есть задача по парсингу каталога сайтов.

1. Пройтись по каталогу

2. Зайти на сайты из каталога (порядка пары тысяч)

3. Стянуть главную и все внутренние страницы первого уровня, на которые есть ссылка с главной.

4. Из текста стянутых страниц выкусить определённый текст (ссылки).

На выходе должна получиться такая база:

- категория сайта в каталоге

- УРЛ сайта

- собственно нужный кусок текста

Кто возьмется?

Сколько денег/времени?

Заявки фрилансеров