Формирование базы данных с помощью парсера
Необходимо реализовать автоматический парсер указанных сайтов для вычитки адресов магазинов, времени их работы и др. информации.
Язык реализации: Python
Желательно использовать библиотеки для парсинга html (lxml, pyquery)
Для каждого сайта нужно сделать отдельный класс, наследник от базового Loader, в котором реализовать метод EnumerateShops(self), возвращающий перечисление всех магазинов, указанных на сайте.
Необходимые для вычитки атрибуты:
shop.address * (адрес)
shop.time (время работы)
shop.city * (регион. Москва или Санкт-Петербург, для остальных городов - область, край, и т.п.)
shop.location * (координаты, вычисляются по адресу через Яндекс.Карты, метод вычитки уже реализован)
shop.phone (телефон)
shop.network * (торговая сеть)
shop.mall (торговый центр, в котором находится магазин)
(если атрибутов без * на сайте нет, то их можно не заполнять, если есть - то обязательно заполнить)
Пример сайта для парсинга: http://www.sela.ru/shops.aspx?issue=all&full=1
Список сайтов для парсинга сообщим по требованию.
Исходный текст базового класса и пример наследника вышлем при начале работы.
Оплата: 1000 магазинов - 1000 рублей .