Парсинг сайта http://averettrade.ru, PrestaShop

Веб-программирование
310 просмотров
02.05.2017
1360×60287 КБ
преста.png

1) Парсин базы в Excel с товарами: получить каждый товар, и его характеристики в базе через разделители ';" 2) Парсить сайт с товарами: получить названия, картинки и описания. Что нужно в результате: 1. Каталог с картинками, картинки проименованны специальным образом. 2. Файл csv, заполненный определенным образом. Состав csv: URL картинки, название товара, характеристики, описания (+ возможны ещё поля). Подводные камни: 1. Надо будет рассортировать характеристики из экселя по ключевым словам. Например, ячейку "Диагональ: 24 дюйма; Вес: 1,4 кг...." распарсить на отдельные столбцы. 2. У товаров в экселе и товаров на сайте нет общего ID, их надо будет сопоставлять по артикулу или названию товара, чтобы не было дублей, а информация по каждому товару была наиболее полная. 3. Не все позиции в базе имеют общий формат, нужно предусмотреть обработку тех товаров, где не полные данные (обработка исключений). [url=https://freelancehunt.com/showcase/?q=Parse]#Parse[/url] [url=https://freelancehunt.com/showcase/?q=Parsing]#Parsing[/url] [url=https://freelancehunt.com/showcase/?q=merge]#merge[/url] [url=https://freelancehunt.com/showcase/?q=excel]#excel[/url] [url=https://freelancehunt.com/showcase/?q=web]#web[/url]. [url=https://freelancehunt.com/showcase/?q=%D0%BF%D0%B0%D1%80%D1%81%D0%B5%D1%80]#парсер[/url] [url=https://freelancehunt.com/showcase/?q=%D0%BF%D0%B0%D1%80%D1%81%D0%B5%D1%80%D1%8B]#парсеры[/url] [url=https://freelancehunt.com/showcase/?q=I_LOVE_FREELANCE]#I_LOVE_FREELANCE[/url] [url=https://freelancehunt.com/showcase/?q=C]#C[/url]++ [url=https://freelancehunt.com/showcase/?q=Qt]#Qt[/url]
PrestaShop