Парсер под instantcms 2.2.1
добрый вечер. вы бы не могли бы написать компонент парсер для движка instantCMS 2.2.1, что бы он http://zakupki.gov.ru/ брал нашу информацию с документами и автоматически опубликовывал на нашем сайте. Механизм такой: с http://zakupki.gov.ru/ по идентификационному номеру всю информацию и опубликовывал на сайте. всю информацию со всех вкладок опубликовывал на нашем сайте, примерно как здесь http://www.zakupki.bashkirenergo.ru/purchase/. я не опубликовываю информацию если какие то вопросы появятся вы задайте, я в свою очередь узнаю ответ и вам сообщаю.
Тех. задание:
Ресурс:
- Сайт работает (instantCMS 2.2.1)
Задача: Разработка парсера для скачивание информаций с сайта: http://zakupki.gov.ru и опубликования на нашем сайте (не ссылок).
Процесс:
1)Пользователь опубликовывая информацию на сайте: http://zakupki.gov.ru, копирует ссылку. пользователь из группы "модератор" заходит в меню в раздел "Закупки" и потом вставляет ссылку на запись закупки (пример) и нажимает на кнопку "Импорт", вся необходимая информация (и еще всю информацию скачивает с вкладок: "Общая информация", "Список лотов", "Документы закупки", "Изменения и разъяснения", "Журнал событий") скачивается в базу сайта (либо в новую базу, либо в имеющуюся)
2) Размещение материала на сайте, с теми же полями и вкладками (дизайн копируется).
Задание:
1) База с информацией хранится в моей БД.
2) При каждом заходе с новым ip-адресом. Теперь сайты умеют блокировать роботов по их IP адресу, если увидят какие-то подозрительные действия. Возможно не сразу, но через какое-то время может случится так, что ваш парсер вам будет говорить, что отработал, а результат будет пустым. Чтобы этого не случилось, нужна куча дополнительных скриптов, которые будут менять ip адрес вашего скрипта и поведение парсера на сайте.
3) Фильтрацию предусмотреть
Стоимость и сроки?
Оставляйте свой предложения