Парсинг сайта

Бази даних
90 переглядів
21.06.2021
1595×1007161 КБ
1.jpg
1681×977236 КБ
2.jpg
1613×997257 КБ
3.jpg

Парсинг сайта https://www.deutsches-krankenhaus-verzeichnis.de. Клиники Германии, около 2000 клиник, необходимо собрать данные с каждой клиники, при этом сохранить структуру файлов как на сайте. Сатй защищен от парсинга, при запросах не возвращает html код страницы, Selenium был заблокирован сайтом. Для обхода защиты и получения html кода страницы было использование расширения браузера, также смена юзер агента при каждом запросе. Очень интересный сайт, для тех кто интересуется парсингом. Заказчик остался доволен работой. Плюс один отзыв в копилку и в портфолио )).
HTMLSelenium