UniDocuments - пакетная обработка текста
Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Утилита используется для пакетной обработки текстовых файлов.
На входу указывается директория с исходными текстами, символы ограничения обрабатываемого текста.
Программа из каждого файла в директории и поддиректориях извлекает текст между символами ограничения.
В тексте убираются все переводы каретки, но с разбивкой на абзацы по набору правил.
Из обработки исключаются тексты, содержащиеся фразы из словарного файла.
Текст проходит обработку простым синонимайзером и добавляется в единый текстовый файл. При этом полностью исключаются дублирующие файлы.