Программирование Python(NLP)

Гость5 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
23.03.2021

Необходимо доработать программу для определения тематики сообщества в vk во вложении. Она выполняет следующий функционал: парсится текст из постов сообщества vk через VK API и выгружается в csv. Далее этот текст обрабатывается алгоритмом LDA и на выходе получается тематическая модель с ключевыми словами, собранным в абстрактные темы.

LDA работает, необходимо доработать следующий функционал:

1. Парсер работает не так как нужно, извлекается только несколько текстов, либо не извлекается вообще. Можно сделать и без помощи VK API, если хотите.

2. LDA распределяет ключевые слова, найденные в тексте по темам, но у них нет названия. Чтобы назвать необходимо сопоставить набор ключевых слов какой-либо существующей тематике на основе каких-нибудь готовых данных например. Тут не обязательно применять машинное обучение, можно какое нибудь более простое решение, главное чтобы хоть как-то работало)

3. Прикрутить простенький GUI с возможностью вставить доменное имя паблика и вывести результат моделирования и тематику(и) на экран.

По срокам 2-3 дня.

По цене ожидаю ваши предложения.