Автопарсер информации с сайтов офиц.партнеров
Есть сайт агентства зарубежной недвижимости. У агентства заключены договора с рядом зарубежных компаний, в том числе предоставляющее официальное разрешение использовать информацию с их сайтов.
Нужно разработать универсальный парсер, который будет по крону запускаться раз в какое-то время, и обеспечивать инкрементальный сбор информации об объектах недвижимости с этих сайтов – первый раз полный сбор, потом сверять с нашей базой, новые объекты добавлять, старые удалять.
У этих компаний, за единичным исключением, нет продвинутых XML-форматов, позволяющих гибко настраивать синхронизацию объектов, поэтому приходится работать с конечным html. HTML стандартный для всех объектов, вот пример страницы объекта одного из партнеров – www.masainternational.ru/...
Немаловажно, что парсер необходимо сделать достаточно универсальным, в возможностью добавления новых масок или темплейтов для новых сайтов, т.к. количество партнеров постоянно расширяется. На данный момент их около 15, с таким же количеством идут переговоры, общее же количество партнеров не ограничено.
Я могу дать свои наработки на php, но они довольно хаотичны и не факт, что их возможно использовать. Список сайтов для парсинга и исходник нашей базы предоставлю выбранному исполнителю. Также дополнительно, при успешной работе, могу предложить работу по развитию сайта агентства.
Прошу сразу указывать примеры аналогичных работ, цены и сроки.