Парсер маркетплейсов
нужно собирать с заданной периодичностью данные с
wildberries.ru (уже есть часть функционала на python, которая умеет забирать указанную категорию)
парсер должен уметь собирать:
- весь каталог
- список категорий товаров
- первые N товаров категорий
- список товаров
периодичность сбора информации 15мин/1ч/1д.
результат в формате json.
будет запускаться на linux сервере.
желателен аналогичный опыт разработки парсеров, которые умеют обходить возможные защиты сайтов (лимит запросов/ip блокировки).
отразите в откликах информацию о наличии такого опыта:
- используемый технологический стек
- скорость парсинга (товаров/час)
- необходимое железо (процессор/ядра/память/диск) и его стоимость владения
- кол-во прокси и их стоимость
укажите город/часовой пояс, рабочие часы, как быстро готовы приступить.