Распарсить данные с сайта
Задача: Пройти по дереву школ вот отсюда (http://www.edu.ru/schools/catalog/) и сложить данные в таблицу.
Поля таблицы (на примере http://www.edu.ru/schools/catalog/school/103514/):
- Название школы
- Название школы без указания региона (+ района, населенного пункта), если он присутствует в названии
- Тип образовательного учреждения
- Принадлежность
- Полный адрес школы
- Распарсенный адрес школы
-- Индекс (если есть)
-- Субъект Федерации
-- Район (если есть)
-- Населенный пункт
-- Улица (+ дом, строение, корпус)
- Сайт (если есть)
- Электропочта (если есть)
- Телефон (если есть)
- Директор (если есть)
- Линк на страницу школы на www.edu.ru
Результат работы это:
1. Если школ <: Excel,="" Access,="" MySQL="" (sqldump).="" Если="" школ=""> 30 000, то MySQL.
2. Скрипт, который обходит дерево ссылок на сайте, и складывает данные в таблицу.