Парсер параметров категорий яндекс-маркета
Необходим веб-парсер, сканирующий параметры товаров в яндекс-маркете.
При запуске парсера, он показывает дерево категорий товаров на яндекс.маркете. Нужно сделать функцию обновления дерева по запросу пользователя, само дерево может хранится в файле.
Дальше пользователь выбирает интересующую КОНЕЧНУЮ (не содержащую больше категорий и имеющую уникальные хар-ки) категорию.
Парсер вытаскивает из этой категории все параметры и отдает файл в котором выводит:
-имя параметра
-тип параметра (флаг, значение, список)
#для типа значение также необходима единица измерения (идет после двух текстовых полей "от" и "до")
#для типа список необходимо сохранить все значения списка
большим плюсом будет возможность скрипта вытащить информацию, скрытую под знаком вопроса.
также в файл должны отпарситься производители (идут в самом начале). Те производители, которых Яндекс пометил как "популярные" должны помечаться в файле как популярные (либо записывать отдельным блоком).
В дальнейшем также потребуется парсер товаров из этих категорий, вполне вероятно, что отдам эту работу тому же исполнителю.
Примеры страниц:
категории: http://market.yandex.ru/catalog.xml?hid=91018
категории: http://market.yandex.ru/catalog.xml?hid=91009
параметры: http://market.yandex.ru/guru.xml?CMD=-RR=0,0,0,0-VIS=160-CAT_ID=1040442-EXF=1-EXC=1-PG=10&hid=91122
попасть в параметры категории можно так:
1. выбираете категорию
2. слева в блоке нажимаете "расширенный поиск"
3. справа в блоке параметров внизу нажимаете "все параметры"
!ВНИМАНИЕ, не у всех конечных категорий есть параметры! Показывать нужно только те у которых есть.