Требуется доработать парсер или создать новый.

Александр17 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
13.01.2012

Задачи: спарсить телефонные номера, указанные в объявлениях на ресурсе cian.ru и сохранить их в формате CSV.

В настройках парсера должна быть возможность:

1. Выбора региона объявлений к парсингу(обязательно москва или московская область + в перспективе или сразу - другой регион, например, ссылкой).

2. Выбора категории недвижимости:

- аренда, продажа;

- коммерческой, жилой или загородной (дома, земля).

Например, стоит задача спарсить все номера по москве и области с категорией аренда квартир.

Соотв., ставим параметры: регион - москва и область; катег. недв. - аренда + жилая.

Итог парсер формирует в CSV файл: один столбец с номерами телефонов в формате: +7_код_сети_7_цифр_номера_телефона, без подчёркиваний, т.е. +74956664433.

Программа может быть как скрипт для удалённого сервера (доступ дам, надо будет поставить), или как скрипт для денвера, или как отдельное приложение. Варианты для локальной машины нежелательны.

На сервере-источнике стоит защита от парсинга, её надо обойти подстановкой прокси и т.п.

Так же есть готовый скрипт для денвера, который устраивает, но который уже не работает из-за защиты, парсит не более 40 страниц (ок. 2000 объявлений, а всего ок. 400 000).

Этот скрипт есть во вложении.

Отвечаем в заявке: - бюджет; - сроки; - метод реализации и решение с защитой от парсинга; - иные комментарии.

Бюджет не более 1500 рублей.