Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Требуется парсер Википедии для сайтов на DLE 12.0 (кодировка 1251) и DLE 14.1

Необходимо, чтобы скрипт парсил содержимое из раздела "Случайная статья" (https://ru.wikipedia.org/wiki/Служебная:Случайная_страница) - там каждый раз случайным образом отображается новая статья.

- В скрипте должна быть возможность указания минимального объема статьи, например, 3000-4000 знаков (если меньше, то происходит пропуск).

- Возможность выбора категории (раздел куда парсим) и автора (имя) новости парсинга.

- Изображения должны загружаться на сайт.

- Все ссылки в статье при парсинге должны быть сделаны не активными.

- Такие блоки (в статье от ВИКИПЕДИИ), как "Содержание", "Примечания", "См. также", "Ссылки", "Литература" должны вырезаться. Также должны вырезаться все таблицы (вместе с содержимым), включая class="infobox vcard" (из нее загружать только одно изображение).

- Все лишние теги из статьи также должны удаляться (span классы, div'ы и прочее).

4 года назад
maxxf
35 летРоссия
14 лет в сервисе
Был
год назад