UniDocuments - пакетная обработка текста

Прикладное ПО
344 просмотра
17.07.2011
UniDocuments - пакетная обработка текста.jpg

Утилита используется для пакетной обработки текстовых файлов. На входу указывается директория с исходными текстами, символы ограничения обрабатываемого текста. Программа из каждого файла в директории и поддиректориях извлекает текст между символами ограничения. В тексте убираются все переводы каретки, но с разбивкой на абзацы по набору правил. Из обработки исключаются тексты, содержащиеся фразы из словарного файла. Текст проходит обработку простым синонимайзером и добавляется в единый текстовый файл. При этом полностью исключаются дублирующие файлы.