Программирование(Python) определение тематики текста

Гость5 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
30.03.2021

Необходимо доработать программу для определения тематики сообщества в vk во вложении. Она выполняет следующий функционал: парсится текст из постов сообщества vk через VK API и выгружается в csv. Далее этот текст обрабатывается алгоритмом LDA и на выходе получается тематическая модель с ключевыми словами, собранным в абстрактные темы.

LDA работает, необходимо доработать следующий функционал:

1. Парсер работает не так как нужно, извлекается только несколько текстов, либо не извлекается вообще. При этом можно придумать альтернативное решение, без VK API.

2. LDA распределяет ключевые слова, найденные в тексте по темам, но у них нет названия. Чтобы назвать необходимо сопоставить набор ключевых слов какой-либо существующей тематике на основе каких-нибудь готовых данных, например, используя словарь тематик.

Недвижимость: дом, квартира, планировка, жилье

Мебель: диван, кресло, стул, стол

и т.д.

Можно чтобы приложение работало не по всем, а например только по нескольким(5 темам). И ,например, на нескольких, зараннее определенных сообществах.

3. Прикрутить простенький GUI с возможностью вставить доменное имя паблика и вывести результат моделирования и тематику(и) на экран.

По срокам 2-3 дня.

По цене жду ваших предложений.