Парсер (граббер) Web страниц (Web pages parser)
Необходимо парсить следующие страницы и получить список e-mail адресов
Результат в CSV файл (т.е. текстовый файл разделенный ; - точка с запятой)
Поля (столбцы):
1. email
2. Контактное имя
Файл результат: rt.csv
Ссылка: https://edu.tatar.ru/index.htm
Представлены все районы региона
Пройти по списку всех районов (например, Нижнекамский - https://edu.tatar.ru/nkamsk)
Далее зайти во все типы учреждений, КРОМЕ детских садов (дошкольное образование), например, https://edu.tatar.ru/nkamsk/type/5 - Дополнительное образование, и пройти по списку всех учреждений и взять email и ФИО директора заведения, если email нет, то ничего не делать.
Список заведений области
Файл результат: sam.csv
Ссылка: http://samobr.ru/includes/ajax.htm
e-mail и ФИО, если email нет, то ничего не делать.
Файл результат: nn.csv
Ссылка: http://www.giport.ru/schools/
Внимание!!! Сайт нестандартный - страницы подгружаются динамически.
Все заведения региона (238 шт.)
Например, http://gimnaziya1.giport.ru/ - Гимназия 1
Необходимо получить e-mail и название организации, если email нет, то ничего не делать.
Исполнение до 18.03.2014