Распарсить два источника (xls и сайт), собрать воедино.
Здравствуйте.
Нужен программист, который умеет парсить данные и отделять мух от котлет.
Цель - собрать из двух источников общий файл .csv и папку с картинками.
Есть два источника данных:
1) База Excel с товарами: без картинок, есть названия товара, характеристики в одну строчку (ячейку) через разделитель.
2) Сайт с товарами: есть названия товара, картинки и описания.
Что нужно в результате:
1. Каталог с картинками, картинки проименованны специальным образом.
2. Файл csv, заполненный определенным образом.
Состав csv: URL картинки, название товара, характеристики, описания (+ возможны ещё поля).
Подводные камни:
1. Надо будет рассортировать характеристики из экселя по ключевым словам.
Например, ячейку "Диагональ: 24 дюйма; Вес: 1,4 кг...." распарсить на отдельные столбцы.
2. У товаров в экселе и товаров на сайте нет общего ID, их надо будет сопоставлять по артикулу или названию товара, чтобы не было дублей, а информация по каждому товару была наиболее полная.
3. Не все позиции в базе имеют общий формат, нужно предусмотреть обработку тех товаров, где не полные данные (обрабтка исключений).
При отдаче заказа интересует ваш опыт в обработке данных и парсинге.
Цена договорная, ориентир $90.
Срок: с учётом всех обсуждений и т.п. - неделя.
Более подробно расскажу при отдаче заказа.