Распарсить данные с сайта
Надо написать код(предпочтительные языки c#, java, python, scala) для извлечения базы товаров с сайта
g00dsmАtrix_ру
Выходной формат json. Учитывая что категорий много не хотелось бы иметь более 20-ти файлов. Можно 1 файл на корневую категорию
Для каждого товара должны бать
code - код
type - категория в виде массива без корневого элемента например ["Продукты питания","Бакалея","Орехи и сухофрукты","Орехи","Арахис","Арахис соленый","Арахис соленый с различными вкусами"]
name - название
rating: - Оценка товара потребителями:
далее по списку с сайта
Состав:
Описание:
Продукт:
ГОСТ/ТУ:
Масса нетто:
Срок годности:
Условия хранения:
Энергетический состав:
Размеры товара:
Количество в коробе (шт.):
Желательно извлеч и изобраения(можно предоставить в виде файлов с именами == кодам).
В качестве результат работы надо будет предоставить файлы с данными, код приложения, фотографии.
Пример json-а который ожидается на выходе
[
{
code:'4612736860023',
name:'ШПРОТЫ В МАСЛЕ «ХОРОШО», 240 Г',
type:['Продукты питания','Гастрономия',' Рыбная гастрономия','Консервы рыбные','Шпроты'],
rating: 8.9,
.... думаю смысл ясен
},
{следующий товар}
]
если у объекта нет какого-то атрибута или он пустой(к примеру отсутсует рейтинг) его(арибута) нет должно быть в выгрузке.
PS Если вы решите что для решения данной задачи проще использовать некий готовый софт, а не писать код(на сайте есть скрытае поля, которые надо обязательно передавать/все прелести ASP.NET ViewState Validation), то это вариант тоже расматривается.
PPS Попробуйте распарсить грид товаров и переход на страницы прежде чем предлогать свои услуги