Perl-парсинг тендерных сайтов
Требуется perl-парсинг 10-20 тендерных сайтов, это базы данных открытой информации на русском и английском языках. Сканирование страниц вывода пейджинга базы (если он есть), определение id тендеров (это ссылки на страницы с информацией о закупке, как правило одна или две), загрузка этих страниц (их коррекция до регулярной структуры при необходимости), загрузка файлов по ссылкам или формам, парсинг текста и заголовков с помощью регулярных выражений (иногда сложных) в xml файл простой структуры, тестирование правильности парсинга.
Вот примеры подобных сайтов: www.burzakup.ru, www.gostrade.ru.
По ряду причин для парсинга используется только perl.
Для контакта требуется icq, телефон/скайп, гарантия разумных сроков.
Буду рад вопросам и комментариям.