Скрипт универсального граббера контента
интересует скрипт универсального граббера контента.
Требования:
1) Граббинг статей из html по средством указания тегов {get} - получить и {skip} – пропустить.
2) Сбор ссылок на статью/новость не только из RSS, но и из HTML ленты
3) Сбор архивов статей и новостей, то есть указывается список ссылок на источник и идёт сбор новостей с этого источника по всем ссылкам разово, и по 1 ссылке по таймеру.
4) Возможность качественной сортировки контента, я указываю источник, дату и мне выводится список новостей ограбленных с этого источника в определённый промежуток времени (нужно для удаления ошибочных статей)
5) Просмотр настроенного сбора новостей до публикации, то есть, я вбиваю все настройки сбора статей, а потом указываю ссылку на источник и проверяю то как будет собираться новость, это нужно во избежание ошибочного сбора статей.
6) Удобная админка, выполненная в профессиональном стиле.
7) Создания неограниченного числа категорий, то есть, к примеру Новости/Спорт/Футбол
8) Обязательно использование mod_rewrite
9) Запуск заданий по крону.
10) Встройка дизайна в движёк сайта. Дизайн уже есть, и он очень простой.
P.S. В общем интересует что то похожее на newsgrabber.info. В случае успешного создания граббера, через 3 месяца будет премия в размере 200$