Написать программу для автоматического парсинга
Требуется программист, который напишет, установит и научит работе, с программой для автоматического и регулярного (один раз в месяц или чаще/реже) парсинга данных с сайтов и экспорта данных в Excel.
Краткое описание задачи:
Этап 1. Есть сайт, на котором расположена (и регулярно обновляется) база данных, требуется с этого сайта, один раз в месяц, автоматически парсить данные. Данные должны экспортироваться в Excel.
В целевой таблице Excel должны быть следующие столбцы:
а. номер лицензии
б. название лицензиата
в. инн лицензиата
г. срок действия c ... по ... (нужно разделить на два столбца)
д. день начала оказания услуг
Ссылка на базу данных, откуда требуется парсить данные https://rkn.gov.ru/communication/register/license/
Мне нужны данные по компаниям, у которых заканчиваются лицензии в период через 1 - 6 месяцев с даты парсинга.
Выпадающее меню "Территория" - нужны данные по всей территории РФ.
Выпадающее меню "Услуга связи" - нужны данные по 7 из 21 услугам (по каким именно сообщу после выбора исполнителя).
Этап 2. Есть сайт, на котором расположены публичные данные по юридическим лицам.
ссылка на сайт https://zachestnyibiznes.ru
При вводе ИНН в поиске, появляется возможность просмотреть информацию о юридическом лице.
Есть ссылка на "Контактная информация" (при нажатии открывается в новом окне).
Нужно спарсить номер телефона с страницы "Контактная информация". Номер телефона должен попасть в столбец "номер телефона" и соответствующую строку исходного юридического лица.
Этап 3. По номеру телефона, ИНН, названию организации - требуется осуществить поиск (яндекс, гугл) веб-сайта юридического лица. Нужно спарсить в таблицу, в соответствующий столбец адрес веб-сайта, адрес email.
В финале Заказчик должен получить автоматический парсинг данных, с исходных сайтов, один раз в месяц (или чаще/реже по запросу). Данные должны экспортироваться в Excel файл. В файле должны быть столбцы 1. номер лицензии 2. название лицензиата 3. инн лицензиата 4. срок действия с 5. срок действия по 6. день начала оказания услуг 7. номер телефона 8. веб-сайт 9. адрес email.