Крупный парсер контента

Алексей17 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
03.08.2010

Нужен парсер контента

Предпочтительнее серверная версия, но возможна и декстопная.

Ресурсы откуда парсить

- market.yandex.ru c автоматическим синонимизайнером через bazzinga API

- torg.mail.ru c автоматическим синонимизайнером через bazzinga API

- marketgid.com с автоматическим синонимизайнером через bazzinga API

- Compendium.com.ua с автоматическим синонимизайнером через bazzinga API

- Amazon.com c автоматическим переводом через translate.google.ru API

- Bestbuy.com c автоматическим переводом через translate.google.ru API

- Target.com c автоматическим переводом через translate.google.ru API

- Walmart.com c автоматическим переводом через translate.google.ru API

- Computershopper.com c автоматическим переводом через translate.google.ru API

- YouReviewElectronics.com c автоматическим переводом через translate.google.ru API

- Newegg.com c автоматическим переводом через translate.google.ru API

- itp.net c автоматическим переводом через translate.google.ru API

- reviews.cnet.com c автоматическим переводом через translate.google.ru API

Что парсить

- название категории

- название товара

- бренд товара

- цена

- характеристики

- составление описаний (краткого и полного, HTML-таблица/список на основе набора характеристик)

- картинки (максимальное разрешение) и видео товара

- комментарии

- рейтинги и оценки

Функции

- сохраняет ссылки на источники информации

- экспортирует в форматы ShopCms, ShopScript, Webasyst, Virtuemart, ShopScript Free, cvs, xml, txt c разбивкой на характеристики.

- показывает количество спарсенных товаров, и статус бана (при работе без прокси)

- остановка парсинга в любой момент.

- добавлять прокси в "режиме онлайн".

- продолжение парсинга с момента остановки.

- обновление базы с фильтрацией на уже добавленный контент.

- парсер указывает, правильно ли добавлена категория, и есть ли в ней товары.

- конвертирор цены, в нужную валюту ! (По умолчанию рубли)

- сравнивает найденные товары и при нахождении двух одинаковых – добавляет информацию в один

Жду

- срок разработки и стоимость

- стоимость разработки дополнительных источников

- технологии и инструменты

- ссылки или информацию про подобные решения (если таковые имеются).