Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Нужно написать парсер 2гис, для работы нашего сайта

Функционал самого сайта:

Клиент пишет свой адрес в графе улица и дом и ему выскакивает список тарифов всех интернет-провайдеров по его дому.

(для примера: spb.justconnect.ru)

Базы от провайдеров нам приходят в эксель таблицах. Проблема в том, что все провайдеры присылают свои адреса (область, город, улица, дом и корпус) в разных форматах. И чтобы поиск провайдера по адресу работал корректно нужно приводить все таблицы к единому виду. Так как есть 2 проблемы: Один и тот же дом у разных провайдеров может быть по разному написан: у кого-то "шкапина 9-11", у кого-то "шкапина 9-11 лит.А", а у кого-то просто "шкапина 9" или "шкапина 9/11". И это всё один и тот же дом. 

Поэтому в качестве эталона я решил выбрать либо 2 гис, либо яндекс карты.

Как должна работать программа:

Из таблицы провайдера вырезается первый адрес, к примеру: "европейский 21 к2, д. кудрово, всеволожский район спб" и загружается в 2гис. 2гис находит какой-то конкретный дом и дальше парсер вырезает адрес этого дома и вставляет в эксель рядом с адресом от провайдера. Если при запросе адреса в 2гис выскакивает два-три варианта адреса, то таблица метится красным цветом и рядом записываются значения тех 2-3 х адресов, которые были предложены. Эти адреса мы будем ручками подправлять. Это может быть в таком случае: мы вводим "бухарестская 41, фрунзенский СПб" и нам 2 гис говорит, что есть только "бухарестская 41 к1 и к2", а без корпуса не существует.

В итоге мы получаем адреса тех же самых провайдеров и каждый адрес записан в одинаковом формате. В дальнейшем можем по ним делать поиск провайдеров на сайте.

5 лет назад
Andrey200981
Андрей 
28 летРоссия
5 лет в сервисе
Был
5 лет назад