Распарсить данные с сайта

Владимир17 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
20.06.2013

Надо написать код(предпочтительные языки c#, java, python, scala) для извлечения базы товаров с сайта

g00dsmАtrix_ру

Выходной формат json. Учитывая что категорий много не хотелось бы иметь более 20-ти файлов. Можно 1 файл на корневую категорию

Для каждого товара должны бать

code - код

type - категория в виде массива без корневого элемента например ["Продукты питания","Бакалея","Орехи и сухофрукты","Орехи","Арахис","Арахис соленый","Арахис соленый с различными вкусами"]

name - название

rating: - Оценка товара потребителями:

далее по списку с сайта

Состав:

Описание:

Продукт:

ГОСТ/ТУ:

Масса нетто:

Срок годности:

Условия хранения:

Энергетический состав:

Размеры товара:

Количество в коробе (шт.):

Желательно извлеч и изобраения(можно предоставить в виде файлов с именами == кодам).

В качестве результат работы надо будет предоставить файлы с данными, код приложения, фотографии.

Пример json-а который ожидается на выходе

[

{

code:'4612736860023',

name:'ШПРОТЫ В МАСЛЕ «ХОРОШО», 240 Г',

type:['Продукты питания','Гастрономия',' Рыбная гастрономия','Консервы рыбные','Шпроты'],

rating: 8.9,

.... думаю смысл ясен

},

{следующий товар}

]

если у объекта нет какого-то атрибута или он пустой(к примеру отсутсует рейтинг) его(арибута) нет должно быть в выгрузке.

PS Если вы решите что для решения данной задачи проще использовать некий готовый софт, а не писать код(на сайте есть скрытае поля, которые надо обязательно передавать/все прелести ASP.NET ViewState Validation), то это вариант тоже расматривается.

PPS Попробуйте распарсить грид товаров и переход на страницы прежде чем предлогать свои услуги

Заявки фрилансеров