Парсер товара Яндекс Маркета
Добрый день!
Требуется создание парсера товара Яндекс Маркета market.yandex.ru
Прошу оценить по общей стоимости работу и все 5 пунктов отдельно. Я готов заплатить за качественный продукт, главное, чтобы все работало и было сделано грамотно.
1) У нас есть наименование товара (можно делать доступ напрямую в БД, можно давать парсеру csv файл из магазина с базой товаров), но чтобы парсер 100% находил товар нужно сделать таблицу, в которой каждому наименованию будет соответствовать «ключ», при помощи ключа парсер безошибочно найдет карточку товара, если таковая имеется на ЯМ. Список ключей для наименования будет создан нами вручную.
Таблица соответствия наименование-ключ в виде файла Excel (.xls)
Пример:
наименование «Телефоны GSM Acer Liquid E Ferrari S100(красный)»
ключ «Acer S100 E» - по этому ключу парсер наиболее вероятно найдет карточку товара.
Также надо перекинуть картинки товара с Яндекса на наш сервер и прописать каждому товару картинку (или картинки, на многие товары более 1-го фото).
2) Дальше надо с карточки взять описание и провести его через набор правил или через обработчик верстки, не знаю как лучше описать это. Суть в том, чтобы описание выглядело красиво и подходило к нашему дизайну.
Либо второе решение – создание шаблона для упаковки собираемой информации в наш дизайн.
Шаблон прилагается к письму
3) Далее нужен отчет о позициях на которые описание не было найдено, чтобы мы сделали его вручную.
На выходе видим отчет в .txt
Пример:
Обработано 100 позиций, 85 описаний добавлено, 15 описаний не найдено.
- 08/11/2010 17:10:45 артикул 4521 не найден на Яндекс Маркете
- 08/11/2010 17:10:45 артикул 4521 ошибка: нет связи с прокси 198.152.123.124
- 08/11/2010 17:10:45 артикул 4521 ошибка: бан Яндекса
4) Следующий шаг – сбор отзывов о товаре, надо собрать отзывы и закинуть к нам на сайт, чтобы под товаром были отзывы (у нас на сайте есть система отзывов, просто надо переместить текст с ЯМ).
Это включается / выключается по желанию. Берем отзывы с той же страницы, где карточка товара (чтобы не ходить далеко).
5) Заключительная часть – защита от бана ЯМ по IP. Здесь видимо надо использовать списки прокси и через них обращаться на ЯМ.
Прокси включается по желанию, также действует random таймер с возможностью задания границ начала и конца временного периода (допустим 10-70 и скрипт в этом промежутке случайно выбирает период времени до следующего соединения с Яндексом)
Скрипт соединяется с базой магазина Webasyst и начинает работу.