Сделать Парсер Python/gjango
ТОЛЬКО С ОПЫТОМ ИСПОЛНЕНИЯ ПОДОБНЫХ ЗАДАЧ
Требуется написать динамичный обновляемый парсинг для сайта косметики, основная задача генерировать товар, описание товара и цена товара со скидками/ценв товара без скидки, с сайта донора.
Для начала сайты доноры
Косметика мертвого моря
выдержать стиль шрифта на нашем сайте, шрифты, заголовки и т.д.
Нужно сделать отдельное приложение для импорта товаров с других сайтов.
- для каждого сайта вручную создается магазин у нас (SellerShop)
- строится соответствие рубрикаторов (Category): нашего и ихнего
- строится соответствие брендов (Brand) + список отсутствующих у нас брендов для ручного добавления в базу
- делается парсер для переноса основной информации согласно структуре нашей БД:
добавляется товар в каталог (Product) с названием, описанием, картинками и т.п. (страна, тип кожи)
добавляется список атрибутов товара (ProductAttr), где они есть (объем, тон, цвет)
добавляются ценовые предложения с учётом атрибутов и магазина (SellerProduct, SellerProductAttr)
- избегать добавления в каталог одинаковых товаров с разных сайтов, для начала это поиск по названию с учетом морфологии (elasticsearch) и составление отдельного списка "возможных дубликатов" вместо добавления товара