Формирование базы данных с помощью парсера

Илья14 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
09.06.2011

Необходимо реализовать автоматический парсер указанных сайтов для вычитки адресов магазинов, времени их работы и др. информации.

Язык реализации: Python

Желательно использовать библиотеки для парсинга html (lxml, pyquery)

Для каждого сайта нужно сделать отдельный класс, наследник от базового Loader, в котором реализовать метод EnumerateShops(self), возвращающий перечисление всех магазинов, указанных на сайте.

Необходимые для вычитки атрибуты:

shop.address * (адрес)

shop.time (время работы)

shop.city * (регион. Москва или Санкт-Петербург, для остальных городов - область, край, и т.п.)

shop.location * (координаты, вычисляются по адресу через Яндекс.Карты, метод вычитки уже реализован)

shop.phone (телефон)

shop.network * (торговая сеть)

shop.mall (торговый центр, в котором находится магазин)

(если атрибутов без * на сайте нет, то их можно не заполнять, если есть - то обязательно заполнить)

Пример сайта для парсинга: http://www.sela.ru/shops.aspx?issue=all&full=1

Список сайтов для парсинга сообщим по требованию.

Исходный текст базового класса и пример наследника вышлем при начале работы.

Оплата: 1000 магазинов - 1000 рублей .