Серия парсеров
Требуются опытные писатели парсеров. Требования к парсерам:
1) устойчивость к обрывам в работе по причинам сбоев в сети, электричестве (т.е. возобновление работы с последнего успешно реализованного шага)
2) использование проксей для избежания бана по айпи (при неполучении ожидаемых данных менять прокси и повторять попытку)
3) режим "обновления", при котором парсится и выдаётся в результат не вся база, а только обновления, актуальные с момента последней выдачи результатов
при наличии капчи обращаться к платному сервису распознавания капчи..
Итак, требуются парсеры на следующие сайты:
1) rul.by Каталог СТО и компаний Грабить структуру, список компаний, подробную информацию о компаниях..;Сохранять картинки, данные максимально распарсить по полям
2) abw.by/allpublic Объявления ;Грабить структуру, cохранять картинки, данные максимально распарсить по полям
abw.by/transportation Грузоперевозки; Грабить структуру, cохранять картинки, данные максимально распарсить по полям
3) realt.by Недвижимость по стране Беларусь Грабить структуру, cохранять картинки, данные максимально распарсить по полям
4) praca.by или аналог Вакансии/Резюме. Грабить структуру, данные максимально распарсить по полям
Результаты парсинга выдавать в csv файле, для последующего импорта в экселевский файл.