Wordpress плагин для парсинга новостей с сайтов СМИ
Валерий11 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
15.09.2018
Необходимо сделать плагин для Wordpress, который будет парсить новости с определенных сайтов. Новости должны парситься с определенной периодичностью. Полученные новости должны добавляться в виде новых записей. Сайты и категории новостей
- EADaily политика
- Politikus в мире, статьи
- ФАН политика
- Zelv в мире
- РуАН лента новостей
- РИА новости в мире
- ПолитИнформ лента новостей
- REGNUM политика, за рубежом
- ИноТВ все материалы
- RT мир
- ИноСМИ политика
- изменение интервала запуска парсера, по умолчанию каждый час
- изменение статуса новых записей, по умолчанию черновик
- спарсить старые новости, например, за последний год
- количество слов в отрывке
- изменение юзера, который размещает новости
- добавление и удаление источников новостей (плюс поставить на паузу)
- Полученные новости должны иметь метки с названием СМИ
- В конец записи должна добавляться ссылка на источник
- Ссылки, курсивы, и жирный шрифт в новости должны сохраняться
- Картинки в новости должны сохраняться
- Видео в новости (YouTube, Vimeo) должны вставляться embed-кодом
- Дата поста должна тянуться с сайта
- В качестве картинки записи должна использоваться первая картинка с сайта
- В запись должен добавляться отрывок первые N слов записи
- Записи не должны дублироваться, нужен контроль дубликатов
- Если в записи есть лишние блоки (рекламные вставки и прочее), то их нужно удалить
- не у всех ресурсов есть RSS-канал (нет у ИноСМИ, РИА и т.д.)
- они умеют парсить сайты, но не умеют выбирать необходимые категории новостей
- нет возможности спарсить старые новости