Парсер RSS

Алексей18 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
23.12.2007

Должен парсить заданные рсс-каналы, складывать награбленный контент в БД (MySQL) и выводить его на сайте в соответствии с заданными правилами. Должен без проблем работать с кодировками рсс-каналов вин-1251, утф-8 и кои-8р и версиями рсс 0.91, 1.0, 2.0.

Вот что-то наподобие этого - www.in-port.ru

Общие требования:

ЧПУ.

Возможность создания неограниченного кол-ва разделов (подразделы не нужны).

Возможность задавать не только название, но и описание+кейворды как для сайта, так и для каждого раздела.

Экспортные рсс-ленты (общая + для каждого раздела), рсс 2.0

Вывод дизайна из шаблона.

Поиск по сайту.

Проверка на дубли (простенько: в базе не может находиться две статьи с одинаковыми заголовками).

Возможность задавать для каждой ленты, из какого рсс-элемента должен забираться текст.

Возможность как стандартной привязки «рсс-лента>раздел», так и автоматической раскладки сграбленных новостей по категориям (из общетематической донорской ленты), путём ассоциации того, что находится в элементе донорской ленты с разделами на сайте. Ничего сложного, при необходимости подробно разъясню.

Очистка текста от хтмл-тегов. Возможность задать, какие теги должны сохраняться.

Возможность задать минимальное количество символов для сграба новости. Новости с меньшим количеством символов игнорируются.

Настраиваемое количество 1. описаний новостей на страницах, где новости идут списком (главная, страницы разделов) 2. новостей в экспортных рсс-каналах.

Блок «Последние новости» с настраиваемым кол-вом выводимых новостей.

Запуск граба отдельным скриптом (для крона).

Возможность задавать для каждой ленты-донора минимальное время между парсами, т.е. одну ленту надо грабить при каждом запуске скрипта, другую – раз в два часа, третью – раз в сутки и т.п.

Работа с изображениями:

Выбор, изображения вставляются хотлинком или сохраняются на сервере.

Ресайз изображений, т.е. на страницах списков уменьшенные, на странице отдельной новости – полные. Желательно, не сохраняя в двух экземплярах, а «на лету» используя GD.

Возможность задать для каждой донорской ленты – в каком рсс-элементе следует искать ссылку на изображение.

Можно организовать не отдельным скриптом, а модулем для какой-нибудь бесплатной кмс типа ВордПресс или ТекстПаттерн, или её доработкой до нужного функционала.

Предложения без указания стоимости рассматриваться не будут. Оплата только через сервис безопасных сделок (проценты плачу я).