Импорт новостей из RSS (Perl)

Дмитрий18 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
27.08.2009

Требуется разрабоатать perl скрипт, который будет публиковать новости с заданного сайта (также представлены в RSS) в 4ех социальныех сетях:

1. http://livejournal.com/

2. http://www.liveinternet.ru/

3. http://blogs.mail.ru/

4. http://vkontakte.ru/

Тут требуется добавлять новость сразу в 2 места

4.1. Заметки

4.2. Группа

INPUT

1) Сайт новостей. Каждая статья представлена датой, заголовком, фотографией, текстом.

2) 4 учетных записи на перечисленных порталах (логин и пароль).

OUTPUT

1) Заголовок

Копируется. В случае если заголовок обрубается блогом, то обрезать его на пробеле и поставить "..." и продублировать в тело статьи и выделить жирным.

2) Тело статьи

2.1. ОБЯЗАТЕЛЬНО вставить изображение. Причем добавлять изображение посредством ссылки. Для "vkontakte" изображение разумеется никуда вставлять не надо.

2.2. Текст

Просто скопировать

2.3. Подпись

Пустая строка

Дата пубикации новости (берется с сайта на котором размещена новость)

URL страницы на которой размещена статья

2.4. Тэги

Вообще тэги нужны. Идеи по автоматизации заполнения тэгов жду с Вашей стороны. Я пока вижу вариант в тэгах прописать имена и названия встретившиеся в статье и заголовке, без дублирования разумеется. Для vkontakte никаких тэгов, разумеется, делать не надо.

ЗАМЕЧАНИЯ

1) "vkontakte" ограничивает размер статьи. Если статья не влезает, то ее надо разрезать на 2. И сделать соответствующие заголовки (Статья про новость (Часть 2), Статья про новость (Часть 1)).

2) Скрипт работает в атоматическом режиме. Запуск скрипта должен происходить примерно каждый час. Эту величину необходимо параметризовать. По умлочанию 60 минут. Как будет работать (через крон, или как демон) можно обсудить. Вообще лучше чтобы он сам по себе висел, и ни от кого не зависел. Предоставить возможность остановки работы скрипта по нажатию клавиши.

3) Все используеые значения ОБЯЗАТЕЛЬНО ПАРАМЕТРИЗОВАТЬ и вынести в начало скрипта:

URL сайта с которого берутся новости, или URI RSS

Порталы на котороые выкладываются новости

Логины/Пароли

Период запуска скрипта

4) Чтобы определить с какой новости начать добавление, использовать дату новости. Т.е. использовать еще 2 параметра:

начальную дату новостей,

дату последней опубликованной новости. Ислючить любые ошибки двойной публикации новостей.

Учетные записи в блогах для разработки и тестирования предоставляться не будут.

Сайт с которого будут браться новости будет сообщен успешному кандидату.

Использовать модули CPAN можно, но обязательно указать какие.

Нашел один скрипт http://www.creativyst.com/Prod/18/

Он вставляет rss как JSMsg. Думаю если покапаться в нем, то можно найти приличные заготовки.

Критерий проверки работы:

скрипт запускается на Вашем сервере на ваших учетных записях. Срок тестирования 3ое суток. При отсутствии новостей, что маловероятно, этот срок может быть продлен. После нашей проверки качества работы скрипта (форматирование и оперативность обработки) переводим 50% суммы. Вы предоставляете рабочий скрипт. Мы устанавливаем на свой сервер со своими учетными записями. Вы помогаете решить нам возникшие вопросы, в том числе по коду. Мы переводим 50%. Оплата по WMZ. Срок разработки - 5 дней. 3 дня тестирование.