Парсер Wiki
Требуется парсер Википедии для сайтов на DLE 12.0 (кодировка 1251) и DLE 14.1
Необходимо, чтобы скрипт парсил содержимое из раздела "Случайная статья" (https://ru.wikipedia.org/wiki/Служебная:Случайная_страница) - там каждый раз случайным образом отображается новая статья.
- В скрипте должна быть возможность указания минимального объема статьи, например, 3000-4000 знаков (если меньше, то происходит пропуск).
- Возможность выбора категории (раздел куда парсим) и автора (имя) новости парсинга.
- Изображения должны загружаться на сайт.
- Все ссылки в статье при парсинге должны быть сделаны не активными.
- Такие блоки (в статье от ВИКИПЕДИИ), как "Содержание", "Примечания", "См. также", "Ссылки", "Литература" должны вырезаться. Также должны вырезаться все таблицы (вместе с содержимым), включая class="infobox vcard" (из нее загружать только одно изображение).
- Все лишние теги из статьи также должны удаляться (span классы, div'ы и прочее).