Морфологический анализатор (python 2.7)
Нужно сделать морфологический анализатор:
Язык Python 2.7
на входе текст
Параметры которые нужно считать:
Плотность - формула - Плотность ключевого слова = ([количество ключевых слов]) * 100 / (общее число слов]
Кол-во слов в тексте
Кол-во предложений в тексте
Кол-во знаков с пробелами в тексте
Кол-во знаков без пробелов в тексте
Точных вхождений( число и список) в тексте
Не точных вхождений( число и список) в тексте
Частотность слов фразы в тексте
!!! Насчет точных и не точных вхождений:
Порядок слов не важен, приводим все слова в одну форму
до начала работы по подсчету мы разбиваем текст по предложениям
Запрос: Лор в Москве // Предлог В мы игнорируем по умолчанию
Лора в москве - это точное вхождение
Лор москва - это точное вхождение
где найти в москве Лора - это точное вхождение
Лору сегодня в москве - это не точное вхождение ( есть фразы по середине основной фразы)
Лор сегодня в москва - это не точное вхождение
!!! Насчет частотности слов:
разбиваем входящую фразу на слова
и по каждому слову считаем сколько раз оно встречается( также не забываем привести к слофоформе)
результат выводим в виде списка (Лор - 10, Москва - 4)
На выходе должна быть питоновская функция , так как это будет оформляться как онлайн сервис для заказчика!