Создание стоп-словаря

Станислав18 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
09.07.2010

СТОП-СЛОВА не несущие смысловой нагрузки при контекстном поиске

это нужно для того чтобы определять тексты одной тематики, но есть много лишних слов которые не несут тематическую нагрузку. вот их нужно найти и обезвредить )

есть файл порядка ~8500 слов в формате: слово - как часто встречается, слова обработаны стеммером (формы и окончания обрезаны)

Нужно выбрать из него слова для стоп-листа.

На выходе 2 файла - файл с тем что осталось и файл с выбранными стоп-словами.

Пришлите файл из ~25 слов которые вы отберете для СТОП-ЛИСТА в качестве теста на то что вы правильно поняли задание.

еще раз пример слов которые подходят для СТОП-ЛИСТА (предлоги, местоимения и тд. ):

перед

нанес

прежн

никуд

ваш

наоборот

кажд

мног

Заявки фрилансеров