Разработать парсер для переноса данных с сайтов компаний в таблицу
Разработать парсер для переноса данных с сайтов компаний в таблицу.
На сайте холдинга по буквам алфавита дан список дочерних компаний с регионом и интернет адресом.
Нужно перенести в таблицу (формат MS Access или Excel):
1. название компании,
2. регион,
3. интернет адрес,
4. комментарий.
По переходу на сайт компании по интернет адресу нужно перенести в таблицу (формат MS Access или Excel) следующие данные:
А. С главной страницы или со страницы Контакты:
5. корпоративный e-mail (если несколько - в одну ячейку),
6. корпоративный телефон (если несколько - в одну ячейку),
Несколько корпоративных телефонов разделять абзацами, несколько e-mail записывать в одну строку через точку с запятой.
Важно. "принадлежность" номера телефона нужно переносить вместе с телефоном, например, телефон референта генерального директора: +7 (499) 263-73-37 или Отдел контроля и документационного обеспечения Тел: +7 (499) 949-43-95 (доб. 3503),
факсы не нужны, адреса не нужны.
B. Со страницы Руководство или Контакты (идеально если парсер сам найдёт
страницу с другим именем, где есть персональные данные - на странице
есть несколько ФИО).
Важно.Переносить данные в связанную таблицу MS Access.
7. ФИО,
8. должность,
9. персональный рабочий e-mail (если есть),
10. персональный рабочий телефон (если есть),
ИЛИ
ВСЕ ФИО одной компании с их должностями, e-mail и телефонами - в одну
ячейку таблицы (предварительно следует задать максимальный размер
ячейки). Несколько человек в ячейке следует записывать в несколько
абзацев.