Программа, которая будет группировать ключевики
Нужна программа, которая будет группировать ключевые фразы по 2-м и более словам.
Программа должны максимально и быстро искать максимально одинаковые фразы из большой базы... и потом группировать их, например в эксель файл
По моему представлению, суть в следующем (возможно и по другому...):
Есть ключевые фразы, например к текстовом файле, каждая фраза с новой строки.
Кол-во фраз не ограничено - можно быть и 100000
Программа должна сгрупировать фразы по 2 и более словам, при этом в этих словах должны быть удалены окончания, т.к. много слов с разными окончаниями будут... (слон, слона, слонов, слоник)
Работать программа должна так: вначале группировка по 6 словам, если не найдено потом 5-ти, 4-м, ... и 2-м, при этом где уже найдены слова, они дальше не используются.
Пишите ваши предложения как вы видите решение этой задачи, а также стоимость, сроки и варианты реализации
Пример такой:
--
слон кормление
слон уход
как кормить слона
уход за слоном
--
Будет группировка: слон кормление и как кормить слона, слон уход и уход за слоном
Ну это как понимаете самый простой пример))) фразы очень разные...