
Написать парсер Wildberries на Python
Разработать парсер маркетплейсов для wildberries.ru. Основная задач это получить HTML страницу и разобрать структуру на отдельный параметры такие как цена, наименование, описание, изображение и т.д.
Предпочтение отдается разработке на Python языке. У парсера должна быть возможность масштабирования до кластерной обработки (100 и более страниц в секунду).
Реализация должна быть модульной с дальнейшей возможностью подключения модулей для парсинга других маркетплейсов.
Интерфейс для внешнего взаимодействия: REST API.
Утилита должна работать автономно в нескольких режимах работы.
Режим краулера. Получения HTML страниц по входному URL. При разработке необходимо учитывать специфику маркетплейса (отработка капч, блокировка IP адреса и т.д).
Режим парсера. Возможность возвращать список товаров если передается URL категории и единичный товар если передается URL страницы товара.
Приветствуются исполнители с опытом парсинга (по другому быть не может, иначе будут расходится сроки) и уровнем не ниже сеньора.
Все подробности будут позже.
Заявки фрилансеров
