Парсер (граббер) интернет-магазинов для Viart
Для работы магазина на Viart по dropship-модели требуется скрипт парсера-грабера интернет-магазинов поставщиков
Функционал в ТЗ написан не категорично - пишите свои мысли и идеи.
ТЗ
- web-интерфейс управления задачами
- хранение информации в базе данных
- экспорт описания товаров в csv(в идеале сразу в базу Viart)
- отдельный функционал парсинга и отдельный конфигурационный файл(модуль) сайтов-поставщиков контента
- настройка соответствия категорий и подкатегорий товара сайта-поставщика с категориями и подкатегориями магазина
- парсинг и импорт всех полей и изображений товара
- выкачивание и переименование фотографий или создание списка для выкачивания через PC
- удобная графическая пользовательская настройка соответствий записей характеристик товара между сайтом-поставщика и записей магазина
- возможность автоматического перевода содержимого полей через автоматический online-переводчик (например google - http://translate.google.com/translate?client=tmpg&hl=ru&u=http://www.cnn.com&langpair=en|ru )
- форматирование записей с учетом многоязычности Viart’а [en]оригинальное описание товара[/en] [ru]переведенное описание товара[/ru]
- ссылка на товар на сайте поставщика в админке ( не видна во фронтенде магазина)
- синхронизациия через соответствие артикулов (позволит перемещять товар в другие категории без потери связки) , отслеживание изменений товара на сайте поставщика. Возможность увидеть изменившиеся позиции. Возможность обновить только выборочные позиции
- отслеживать изменения позиций(например цены, комплектности, наличия на складе) на сайте вручную или автоматически
- вкл-выкл автоматическая актуализация цены с сайта-поставщика. Оповещение по e-mail об изменении цены на определенную величину.
- отслеживание новых позиций на сайте поставщика
- групповое изменение цен на товары
- шедулер обновления парсинга по расписанию
- многопоточность запросов и возможность пускать запросы не напрямую(для борьбы с блокировкой от частого сканирования)
- поддержка нескольких аккаунтов с назначением прав(например контент-редактор, менеджер продаж, маркетолог...)
- система фильтров ( по источнику, категории, ключевому слову...)
* тип контента источников сырой html