Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Список требований к парсеру:

1. Парсер должен работать онлайн на сервере в связке с движком магазина. На каком движке Вы смогли бы реализовать такой парсер? Это может быть любая подходящая и хорошо знакомая Вам опенсорсная CMS.

2. Парсер должен парсить только раздел автозапчасти   http://allegro.pl/czesci-samochodowe-620   . В разделе около 24 тысяч категорий и подкатегорий, которые должны формировать такую же древовидную структуру как на сайте доноре.

3. При парсинге должны копироваться такие данные из карточки товара, а именно: Заголовок, номер лота, фотографии, состояние (новый или б/у). Желательно чтобы сами фотографии не скачивались, а парсились только ссылки на изображения на сервере allegro.

4. Также должна парсится и цена товара +доставка "pobraniowa" с возможностью ее дальнейшей конвертации, Злотый - Гривна или $ и умножения на нужный коэффициент заданный  в админке.

5.Так как все названия на сайте доноре  на польском языке то желательно чтобы при парсинге названия товаров переводились  с польского на русский.С гугл переводчиком наверно ничего не получится из-за неоправданной дороговизны (17миллионов названий товаров, каждое из которых состоит из как минимум 15-20 символов, нетрудно подсчитать в какую сумму обойдётся перевод   такого объёма текста) и корявым переводом. В разделе почти все слова, это названия запчастей которые повторяются тысячи раз, всего же в автомобиле 5-10 тысяч наименований запчастей которые нужно перевести, плюс некоторое количество общепринятых слов таких как левый, правый, задний, передний и т д. Возможно ли осуществлять перевод при помощи какого-то специализированного промышленного словаря или может даже составить его самостоятельно? Какие могут быть варианты реализации подобного переводчика?

6. Товары при парсинге должны попадать в «правильные» соответствующие им категории и подкатегории товаров.

7. Должна быть возможность запускать парсер в автоматическом режиме по расписанию, скажем один раз в сутки. При этом парсер должен по номеру лота проверять наличие на сайте донора.

8. Парсер должен иметь возможность работать через прокси или другие анонимайзеры, на случай если сайт донор будет вводить какие либо ограничения.

9. Парсер должен иметь такую же форму поиска как и в http://www.global-cars.com.ua (марка, модель, поисковое окно для названия детали)То есть пользователь выбирает в выпадающем списке формы марку автомобиля, далее в другом окошке формы становится доступен список моделей для данной марки и пользователь выбрав ее и введя название требуемой детали осуществляет поиск.

Хотелось бы получить от вас развёрнутый ответ с комментариями по  каждому из требований к парсеру из списка выше.

5 лет назад
andrijromanchuk
48 летУкраина
5 лет в сервисе
Был
5 лет назад