Парсер поиск яндекс-гугл (возможно Зенобокс, не обяз.)

Виталий9 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
16.07.2017

Здравствуйте!

Требуется парсер яндекс и гугл поиска и сбор данных в общую базу по параметрам, читайте далее подробнее задание. Возможно вы это сделаете на Зенопостере, Zennoposter, (zennobox, зенобокс).

Прежде чем как добавляться и писать, пожалуйста покажите:

1. От вас требуется показать реализацию парсера (спарсить 2 страницы по нише (пример): "Мягкая мебель на заказ") или показать реализацию уже готовых ваших решений!

2. Ваша цена за реализацию?

Моя задача отобрать спеца, который сделает парсер, чтобы получать номера телефонов, адресов сайтов, и др. с поисковых машин по интересующим нас запросам. Парсер, который будет собирать базу и брать из своей базы, 1- номер городской, 2-ИНН или ОГРН, 3- также сайт, затем прогонять эту информацию через определенные сайты (их всего 3-4), а потом дополнять базу с информацией в соответствующие поля!

Необходимые поля: 1. город, 2. страница в поисковике на которой находится сайт (номер страницы), 3. Трафик на сайте 4. метка рекламных полей. 5. сам сайт, 6. ИНН, ОГРН. 7. телефон (городские и формат +79998887766 доставать все номера), 8. емаил

Подробнее:

Задача в том, что нужно собирать базу в csv (в которой столбцы с номерами, емаил, сайтом) (ИНН и ОГРН и ИП и ООО, на сайтах выглядит так: https://s.mail.ru/2q7W/m1Y3a7YFQ или бывает написано сразу ИП или ООО, вот так: https://s.mail.ru/5zQf/vTQt4MdSn то есть уже указан ИП, нужно только выдернуть, или выдернуть через ИНН)

В парсере необходимо собирать ИНН и ОГРН и ИП и ООО, для того чтобы узнать имя руководителя (ИП Иван Иванович или ООО “Госстрой”, но по ИНН все равно нужно узнать ФИО ген. дир. этого ООО), это мы будем делать с помощью сайта rusprofile.

1. Автоматически брать номер (городской! (не сотовый!)), вставлять на этот сайт https://www.rossvyaz.ru/activity/num_resurs/registerNum/ получать от туда информацию по оператору и городу, смотрите скриншот https://s.mail.ru/9qas/FQZztWnFk Затем добавлять эту информацию в базу к соответствующим полям, заносить обратно в базу в соответствующие поля  (дополнять базу информацией).

2. Подобным образом делать с этим сайтом http://www.rusprofile.ru/id/2704702, только доставать ФИО руководителя, см. скрин https://s.mail.ru/9N38/xMsDnvzfj и заносить обратно в базу в соответствующие поля (дополнять базу информацией)

3. Для списка сайтов проставить количество визитов! Собирать информацию по траффику (посещения за последний месяц) с сайта https://www.similarweb.com, то есть брать сайт из базы, вставлять его на симиларвеб и забирать от туда данные по трафику и обратно заносить в базу в соответствующие поля. (Сейчас я это делаю вручную, с помощью расширения хром см. скрин https://s.mail.ru/7YAC/UDU2fwxbP)

4. Берем из базы ИНН или ОГРН (что есть в нашей базе, приоритет на ИНН) и вставляем его на сайт http://www.rusprofile.ru и забираем данные о ген. директоре или руководителе или ИП, затем вносим их в нашу базу в соответствующие поля, см. скрин https://s.mail.ru/9uSw/D5sU5KkkX

5. Еще будет обращение на один сайт, с которого нужно будет доставать финансовый отчет по ИНН. Но он пока в процессе определения.

Важные требования:

1-Быть на связи ежедневно и давать краткий отчет до о проделанной работе. Я буду постоянно на связи в скайп, вацап, телеграм, вибер.

Жду ваших предложений!