Парсер сайта
Создать парсер сайта ЕРЗ.РФ(erzrf.ru/)
1. Обеспечить выгрузку всех параметров по Застройщикам, подробнее на картинках.
Выгрузить в файл zastroyshicki.csv:
2. Выгрузка Объектов строительства ЖК, подробнее на картинках.
project-zk.csv
id_жк;параметр1;параметр2...параметрN
3. Выгрузка Домов объектов строительства, подробнее на картинках.
project-zd.csv
id_дома;id_жк;параметр1;параметр2...параметрN
Связать ID_дома с ID_жилого комплекса в двух файлах.
Требования:
- Пункты 1, 2 выполнить отдельными функциями, которые можно запускать либо из одной программы либо разными программами.
- Необходимо предусмотреть запуск выгрузки по регионам(Москва, Новосибирск и другие).
- Предусмотреть обход блокировки, например, прокси для запросов свыше 10000 в сутки.
Сделать, чтобы программа предварительно мерила скорость прокси и формировала из общего списка прокси, прокси с хорошей скоростью и качеством в отдельный список и работала по нему выборочно(случайным образом).
- Написать на языке Python
- Передать исходные коды и исполняемые файлы.
- Скрипт должен отработать выгрузку всех ЖК и Застройщиков за срок не более 3 часов.
Заявки фрилансеров
