Perl-парсинг тендерных сайтов

Виталий17 лет в сервисе

Данные заказчика будут вам доступны после подачи заявки

21.08.2008

Требуется perl-парсинг 10-20 тендерных сайтов, это базы данных открытой информации на русском и английском языках. Сканирование страниц вывода пейджинга базы (если он есть), определение id тендеров (это ссылки на страницы с информацией о закупке, как правило одна или две), загрузка этих страниц (их коррекция до регулярной структуры при необходимости), загрузка файлов по ссылкам или формам, парсинг текста и заголовков с помощью регулярных выражений (иногда сложных) в xml файл простой структуры, тестирование правильности парсинга.

Вот примеры подобных сайтов: www.burzakup.ru, www.gostrade.ru.

По ряду причин для парсинга используется только perl.

Для контакта требуется icq, телефон/скайп, гарантия разумных сроков.

Буду рад вопросам и комментариям.