Парсер цен из разрозненных HTML прайс-листов
Суть задачи – требуется парсер, который будет собирать из разных источников информацию о ценах на медицинские услуги и импортировать ее на сайт (DLE) в единую сводную таблицу с возможностью сортировки.
Также необходимо связать импортируемую информацию с каталогом клиник на сайте (в единой таблице цен генерируются ссылки на клиники, в профиле клиники генерируется таблица цен для данной клиники)
Информация представлена в текстовом виде на сайтах клиник и в нескольких ручных агрегаторах, т.е. примерная структура поиска выглядит так (это мое видение, обсуждаемо):
1. Заводится определенный набор услуг
2. Заводится определенный набор клиник
3. Для каждой услуги вручную указывается УРЛ страницы прайса каждой из клиник с данной услугой, а также конкретные параметры расположения информации на странице (всю информацию предоставлю)
Основные моменты:
1. Нужен простой код с возможностью быстрого внесения системных правок
2. Возможность оперативно добавлять в систему или удалять источники информации, добавлять/удалять отдельные услуги, для которых собираем цены. Автоматизировать данное добавление не получится, но оно должно быть предельно удобным.
3. Максимальная совместимость с DLE
4. Частых обновлений не требуется (раз в неделю максимум), но нужна возможность обновления по запросу. Нежелательно, чтобы обновления грузили/вешали основную базу сайта
От вас - разумная цена и сроки, портфолио. Приветствуются рацпредложения :) Все детали готов уточнить в личке, подробное ТЗ - с выбранным исполнителем.