Парсер для сканирования cайта моего поставщика

Александр15 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
09.07.2010

Нужно создать парсер для сканирования cайта моего поставщика (сам он не возражает)

мой интернет магазин – на базе Webasyst Shop-script

Что нужно:

1. скопировать выбранные категории товаров Поставщика на мой сайт

2. настроить автоматическое еженедельное добавление новых категорий и оповещение по эл. почте

3. настроить обновление цен из XLS.

Интересует цена и сроки

сайт поставщика вышлю по запросу. Информация там структурирована. Расширенный поиск по характеристикам товара имеется.

=======================

Выдержки из ТЗ

Все доп характеристики вносятся в числовом или текстовом формате (а не выбираются из предустановленных значений.

название сайта вышлю по запросу

Правила внесения товара:

1. товар в каталог добавляется с нулевой ценой и нулевым количеством.

2. из названия товара убираем код и название группы. Т.е. из названия «552172 Коммуникатор HTC T8585 HD2 LEO» оставляем «HTC T8585 HD2 LEO»

3. все полученные характеристики товара – тип процессора, вес, диагональ и прочее разносятся в свойства товара. Т.е. вес ноутбука должен попасть в свойство товара «Вес». Простого текста должно быть по минимуму.

4. все числовые значения в рамках одной характеристики должны иметь единые единицы измерения. Т.е. если частота процессора измеряется в Мгц (у одного из товаров), значит и у всех товаров она должна быть в Мгц, либо все в Ггц! Но не часть данных в Ггц, а часть в Мгц – расширенный поиск будет тупить.

5. формат записи названия характеристики: название характеристики, единица измерения. После двоеточия идет значение характеристики. Пример, у донора «Размер оперативной памяти: 448 Мб» у нас должно быть «Размер оперативной памяти, Мб: 448» Движок не позволяет сделать иначе.

6. все фото добавляются.

7. последние 2 характеристики генерируется следующим образом:

первая: «Купить» + #название товара# + «с оплатой курьеру можно в городах: Новосибирск, Барнаул, Бийск, Горно-Алтайск, Кемерово, Красноярск, Нижневартовск, Новокузнецк, Омск, Сургут, Томск.»

вторая: «Купить» + #название товара# + «можно, оставив заказ по телефону, электронную почту или через корзину».

«Купить» + #название товара# – выделяется жирным

8. Краткое описание товара добавляется в описание товара на странице товара + в раздел «Краткое описание товара» (т.е. и туда и туда).

Режим работы парсера:

1. скопированные товары должны распределяться по категориям. Категории будут соответствовать категориям Поставщика. Т.е. Ноутбуки АСУС попадают в раздел сайта Ноутбуки – АСУС. Желательно создать таблицу соответствий категорий, т.к. у нас структура категорий может меняться

2. появившиеся (новые) позиции у поставщика автоматически добавляются интернет-магазин. О новых позициях приходит сообщение по электронной в формате: название товара, категория, ссылка на товар, цена у донора. Новинки сканируются еженедельно.

3. пользователь выбирает категории донора, которые будут парситься (при этом все включенные подкатегории так же парсятся)

Расстановка цен:

1. Цены Поставщика берутся из экселевского файла //Вышлю по запросу//

2. артикул на моем сайте будет создаваться следующим образом английская «а» + код товара в прайсе у Поставщика (см. столбец А). Т.е для товара с кодом 89808 в моем сайте будет соответствовать товар с артикулом a89808. Артикул будет проставляться ручками.

3. цена на моем сайте по принципу (если цена до 5 тыс. руб, то плюс 50 руб, если до 7, то плюс 60 и т.д.).

4. Если товар из прайса отсутствует на сайте Система сообщает об этом. Например, высылается экселевский файл с позициями, артикулы которых отсутствуют на моем сайте. Желательно, чтобы не приходило письмо со списком отсутствующих товаров в теле письма (список должен быть в файле).

5. цены обновляются ежедневно.