Необходимо сделать простой парсер.
Необходимо сделать простой парсер.
На сайте циан.ру по ссылке: необходимо спарсить данные квартир. Делается это просто. Нажимается кнопка- сохранить в exel(функция дается самим сайтом) http://prntscr.com/m06xk2 . Однако есть ограничение. Скачивается всего по 200 объектов максимум. Поэтому надо разбить например по цене: 50000-51000 руб. 51-53000 53000-55000 и т.д. И в несколько подходов скачать файлы.
2) Скачанные файлы необходимо сравнить с нашей бд.(тоже ексель файлы) Параметры сравнения: адрес+ количество комнат.
Те адреса которые совпадают, надо выдать списком.
3) Нужен стоп лист. То есть объекты собранные с циан вчера, попадают в стоп лист. На сл. день парсер скачивает объекты с циан, сравнивает адреса с вчерашними, и выдает только те, которые не были добавлены вчера. Все.
Должна быть возможность добавить прокси.