Парсер yandex карты, (Selenium browser driver)
У нас есть задача парсинга сайта: yandex maps
Цель — сбор базы данных медицинских учреждений Санкт-Петербурга и Ленинградской области:
- наименование организации
- адреса
- телефоны
- категория/подкатегория/специализация/подспециализация
- описание
- координаты
- метро
- социальные сети
- рейтинг и кол-во голосов
- отзывы
Наиболее важен последний пункт — отзывы, необходимо собрать отзывы пользователей об организации.
Парсер будет под Linux собирать данные из яндекс и складывать их в БД mysql., полностью воссоздавать и обновлять БД в части Мед учреждений СПБ и ЛО.
На выходе это будет скрипт Node.js или Python, который управляя браузером Chrome через Selenium, соберет данные из боковой панели яндекс карт по ряду запросов, и сложит их в БД Mysql.
Работаем только через безопасную сделку на бирже.
ТЗ прикреплено в файле docx