Парсер Гугл
Владимир7 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
26.03.2018
Парсер на основе headless браузера
Требования к парсеру
- Должен уметь ходить через прокси с авторизацией и без
- Должен оперировать куками и прочими хранилищами как обычный браузер, т. е. запоминать между запусками (обычно headless браузеры стартуют пустыми, поэтому нужно применять определенные профили в зависимости от IP:PORT прокси)
- Желательно уметь задавать разное окружение (плагины, разрешение, шрифты, юзерагент и т.д.) проверять можно тут http://www.fingerprint.pet-portal.eu/ чтобы в итоге можно было привязать один IP:PORT к одному окружению и чтобы между собой они были минимально похожи
Если в процессе работы получил капчу нужно решить её через сервис антикапчи.
Есть полное ТЗ которое описывает формат данных между сервером заданий и парсером и прочие тонкости, после определения исполнителя.