Парсинг сайта http://averettrade.ru, PrestaShop
1) Парсин базы в Excel с товарами: получить каждый товар, и его характеристики в базе через разделители ';"
2) Парсить сайт с товарами: получить названия, картинки и описания.
Что нужно в результате:
1. Каталог с картинками, картинки проименованны специальным образом.
2. Файл csv, заполненный определенным образом.
Состав csv: URL картинки, название товара, характеристики, описания (+ возможны ещё поля).
Подводные камни:
1. Надо будет рассортировать характеристики из экселя по ключевым словам.
Например, ячейку "Диагональ: 24 дюйма; Вес: 1,4 кг...." распарсить на отдельные столбцы.
2. У товаров в экселе и товаров на сайте нет общего ID, их надо будет сопоставлять по артикулу или названию товара, чтобы не было дублей, а информация по каждому товару была наиболее полная.
3. Не все позиции в базе имеют общий формат, нужно предусмотреть обработку тех товаров, где не полные данные (обработка исключений).
[url=https://freelancehunt.com/showcase/?q=Parse]#Parse[/url] [url=https://freelancehunt.com/showcase/?q=Parsing]#Parsing[/url] [url=https://freelancehunt.com/showcase/?q=merge]#merge[/url] [url=https://freelancehunt.com/showcase/?q=excel]#excel[/url] [url=https://freelancehunt.com/showcase/?q=web]#web[/url]. [url=https://freelancehunt.com/showcase/?q=%D0%BF%D0%B0%D1%80%D1%81%D0%B5%D1%80]#парсер[/url] [url=https://freelancehunt.com/showcase/?q=%D0%BF%D0%B0%D1%80%D1%81%D0%B5%D1%80%D1%8B]#парсеры[/url] [url=https://freelancehunt.com/showcase/?q=I_LOVE_FREELANCE]#I_LOVE_FREELANCE[/url] [url=https://freelancehunt.com/showcase/?q=C]#C[/url]++ [url=https://freelancehunt.com/showcase/?q=Qt]#Qt[/url]
PrestaShop