Парсинг — набор скриптов для парсера DataCol (много разных сайтов)
Скрипты для парсинга цен на сайтах разных жилых комплексов и домов.
Объём — около 150-200 скриптов, регулярно будут добавляться новые.
Основные типы парсеров (особенности):
- классические (для datacol, - сбор ссылок на конечные страницы, парсинг конечных страниц)
- парсер popup-окон (парсинг ссылок по javascript, парсинг popup)
- парсер данных из таблицы (одна страница с html таблицей или описание html-текстом минимальных цен для квартир)
- везде нужно приводить некоторые выходные поля к определенному виду (например, срок сдачи - для контроля одно поле оставляется как есть, но дополнительно инфа раскидывается в два поля - год и квартал - данные в которые извлекаются регэкспом из исходника)
Примеры сайтов для парсинга (для оценки "берусь/не берусь") - по запросу.
Список полей для парсинга (для всех скриптов выходные поля одинаковые)
Вывод данных: в CSV в каталог на диск C: и на FTP в заданном формате
Отправка оповещений о результатах парсинга на емайл.
Оплата:
- только постоплата или поэтапная оплата (несколько скриптов предоставили - получили 80%; следующая партия - получили остаток за предыдущую и 80% за текущую; сказали, что всё, следующую партию уже не сделаете - получаете остаток за предыдущю партию — так я хоть в курсе буду, занимаются следующей партией или нет)
- исполнитель должен быть на связи 1-2 часа в день для того, чтобы иметь возможность уточнять ТЗ, предпочтительно скайп, можно и другие виды связи.