Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

http://ice-core.net/Text-Analyzer/textanalyzer.html

1. Исходные данные:

1.1. Сравнение текста с эталоном

1.2. Сравнение текстов в двух направлениях

1.3. Сравнение списка файлов с эталоном

1.4. Сравнение списка файлов в двух направлениях

1.5. Сравнение списка файлов с отбором по критерию уникальности

2. Настройка выборки шинглов

3. Учет фактора морфологии (функция Левенштейна)

4. Стемминг (процесс нахождения основы слова для заданного исходного слова)

5. Корректировка содержания:

5.1. Удаление русских символов

5.2. Удаление английских символов

5.3. Удаление цифр

5.4. Удаление знаков пунктуации

6. Копирование выбранных файлов из списка результатов обработки в указанную папку

7. Изменение размеров шингла (3-20)

8. Автоматическая корректировка текста:

8.1. Удаление стоп-слов

8.2. Удаление служебных символов

8.3. Процедурная обработка текста при помощи скриптов. Позволяет очистить текст практически от

всех лишних символов, включая теги

8.4. Очень гибкая настройка

8.5. Утилита для создания скриптов «Script Editor»

9. Сохраняемые профили настроек для выполнения сравнения в несколько кликов

10. Импорт форматов *.doc, *.rtf, *.htm, *.html, *.mht

11. Расширенный просмотр результатов:

11.1.Отображение всех шинглов текста

11.2.Отображение совпавших шинглов

12. Большая скорость обработки

13. Выбор режима отображения данных