Автопарсер информации с сайтов офиц.партнеров

Виталий19 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
08.12.2010

Есть сайт агентства зарубежной недвижимости. У агентства заключены договора с рядом зарубежных компаний, в том числе предоставляющее официальное разрешение использовать информацию с их сайтов.

Нужно разработать универсальный парсер, который будет по крону запускаться раз в какое-то время, и обеспечивать инкрементальный сбор информации об объектах недвижимости с этих сайтов – первый раз полный сбор, потом сверять с нашей базой, новые объекты добавлять, старые удалять.

У этих компаний, за единичным исключением, нет продвинутых XML-форматов, позволяющих гибко настраивать синхронизацию объектов, поэтому приходится работать с конечным html. HTML стандартный для всех объектов, вот пример страницы объекта одного из партнеров – www.masainternational.ru/...

Немаловажно, что парсер необходимо сделать достаточно универсальным, в возможностью добавления новых масок или темплейтов для новых сайтов, т.к. количество партнеров постоянно расширяется. На данный момент их около 15, с таким же количеством идут переговоры, общее же количество партнеров не ограничено.

Я могу дать свои наработки на php, но они довольно хаотичны и не факт, что их возможно использовать. Список сайтов для парсинга и исходник нашей базы предоставлю выбранному исполнителю. Также дополнительно, при успешной работе, могу предложить работу по развитию сайта агентства.

Прошу сразу указывать примеры аналогичных работ, цены и сроки.