Требуется доработать парсер или создать новый.
Задачи: спарсить телефонные номера, указанные в объявлениях на ресурсе cian.ru и сохранить их в формате CSV.
В настройках парсера должна быть возможность:
1. Выбора региона объявлений к парсингу(обязательно москва или московская область + в перспективе или сразу - другой регион, например, ссылкой).
2. Выбора категории недвижимости:
- аренда, продажа;
- коммерческой, жилой или загородной (дома, земля).
Например, стоит задача спарсить все номера по москве и области с категорией аренда квартир.
Соотв., ставим параметры: регион - москва и область; катег. недв. - аренда + жилая.
Итог парсер формирует в CSV файл: один столбец с номерами телефонов в формате: +7_код_сети_7_цифр_номера_телефона, без подчёркиваний, т.е. +74956664433.
Программа может быть как скрипт для удалённого сервера (доступ дам, надо будет поставить), или как скрипт для денвера, или как отдельное приложение. Варианты для локальной машины нежелательны.
На сервере-источнике стоит защита от парсинга, её надо обойти подстановкой прокси и т.п.
Так же есть готовый скрипт для денвера, который устраивает, но который уже не работает из-за защиты, парсит не более 40 страниц (ок. 2000 объявлений, а всего ок. 400 000).
Этот скрипт есть во вложении.
Отвечаем в заявке: - бюджет; - сроки; - метод реализации и решение с защитой от парсинга; - иные комментарии.
Бюджет не более 1500 рублей.