Парсинг данных ссайта
Привет, есть ТЗ легкое для тебя.
Надо сделать постоянный парсинг сайта https://www.tripadvisor.com
тут выбран город Калифорния, слева в фильтре Рестораны, Пицца - http://prntscr.com/hin7pt
в частности интересует эта ссылка: https://www.tripadvisor.com/Restaurants-g60713-San_Francisco_California.html
собрать:
1. Имена ресторанов
2. Ссылка на их веб-сайты, которые находятся на внутренних страницах
возьмем за пример 2-й ресторан в списке - http://prntscr.com/hin8y3
3. Ссылка на Имейл - http://prntscr.com/hin9bs
4. Просканировать сайт каждого ресторана и найти ссылку на Фейсбук (facebook.com/..) и Инстаграм и Имейл (если имейл не получилось взять с анкеты на портале)
5. Сделать интерфейс парсера, чтобы можно было задать:
- Город/Штат США,
- после этого выбор Опции Cousine (кухня): Pizza
- получить таблицу результатов в виде excel-файла.
*возможность загрузки Парсера с Локального Сервера на любом компьютере.
Сколько мне обойдется 1-3 пункты и +4 если?
Что по срокам?
Спасибо.