Парсинг Яндекс Маркет
Добрый день.
Требуется СПАРСИТЬ! характеристики моделей и другую информацию с сайта Яндекс.Маркет
Каким парсером и как вы это будете делать не важно.
Нужен именно результат парсинга.
1) На вход
Список урлов 95772 моделей
https://market.yandex.ru/product--muzykalnyi-tsentr-mystery-mmk-809u/6054361
https://market.yandex.ru/product--muzykalnyi-tsentr-mystery-mmk-575ip/6182339
https://market.yandex.ru/product--muzykalnyi-tsentr-jvc-ux-vj5be/7707520
https://market.yandex.ru/product--muzykalnyi-tsentr-jvc-ux-vj5te/7707521
https://market.yandex.ru/product--muzykalnyi-tsentr-jvc-ux-vj5ve/7707522
и т.д.
(общий объем урлов моделей около 1.6 млн, но для первого тестового заказа выделяется категория "Электроника"
в случае удачного сотрудничества возможны заказы на парсинг других категорий)
2) Требуется "разобрать" полученные страницы.
3) сформировать xml (можно json)
4) На выходе единый xml (можно json) по всем моделям.
И архив с исходниками страниц - не обязательное, но желательное условие.
п.с. Маркет активно защищается от ботов! Просьба учитывать это при указание срока выполнения.