ПАРСЕР битрикс
Техническоезадание на создание парсера дляинтернет-магазинаПарсерс сайта citilink.ru
- Необходимо настроить парсер всех товаров всех
категорий с сайта citilink.ru.
- Парсер должен обновлять товары в автоматическом
- Необходимо настроить возможный «обход» защиты
- Так как предполагаемых товаров на сайте
- Поля, которые должны быть заполнены у каждого
режиме 1 раз в неделю (обновление цен товаров, текстового описания;
добавление новых товаров, отсутствующих
в предыдущей выгрузке).
сайта citilink.ru от подобной выгрузки. На данный момент
выгрузка возможна (в среднем) только
для первых 120 товаров одной категории,
после чего возникают ошибки вида
«Array([0] =>
[https://www.citilink.ru/catalog/mobile/tablet_pc/475593/]Ошибка
соединения. Некорректный URL или ошибка
на стороне стороннего сайта.[429]
[1] => Селектор контента на детальной странице
товара не найден
[2] =>[3] => [https://www.citilink.ru/catalog/mobile/tablet_pc/475593/] - Не
введено название.
Обязательное
поле "Символьный код" не
заполнено.
)». После возникновения этих ошибок выгрузка
товаров для других категорий также
работает с вышеуказанной ошибкой в
течение неопределенного времени (от
нескольких часов до одних суток).
citilink.ru большое количество (товаров только из категории
ноутбуки более 900), выгрузка товаров в
ручном постраничном режиме (с 1 по 3, с
4 по 6 и т. д.) и в размере 30-40 штук за
один раз неудобна.
товара (при наличии на сайте citilink.ru):
- Название товара
- Краткое описание
- Главное изображение товара
- Дополнительные изображения товара
- Цена
- Текстовая информация о товаре — описание,
технические характеристики.
- Аналогично пунктам 1- 4 из описания «Парсер с сайта citilink.ru».
- Поля, которые должны быть заполнены у каждого
товара (при наличии на сайте onlinetrade.ru):
- Название товара
- Главное изображение товара
- Дополнительные изображения товара
- Цена
- Текстовая информация о товаре — описание,
технические характеристики на вкладке
«Описание».