Программирование(Python) определение тематики текста
Необходимо доработать программу для определения тематики сообщества в vk во вложении. Она выполняет следующий функционал: парсится текст из постов сообщества vk через VK API и выгружается в csv. Далее этот текст обрабатывается алгоритмом LDA и на выходе получается тематическая модель с ключевыми словами, собранным в абстрактные темы.
LDA работает, необходимо доработать следующий функционал:
1. Парсер работает не так как нужно, извлекается только несколько текстов, либо не извлекается вообще. При этом можно придумать альтернативное решение, без VK API.
2. LDA распределяет ключевые слова, найденные в тексте по темам, но у них нет названия. Чтобы назвать необходимо сопоставить набор ключевых слов какой-либо существующей тематике на основе каких-нибудь готовых данных, например, используя словарь тематик.
Недвижимость: дом, квартира, планировка, жилье
Мебель: диван, кресло, стул, стол
и т.д.
Можно чтобы приложение работало не по всем, а например только по нескольким(5 темам). И ,например, на нескольких, зараннее определенных сообществах.
3. Прикрутить простенький GUI с возможностью вставить доменное имя паблика и вывести результат моделирования и тематику(и) на экран.
По срокам 2-3 дня.
По цене жду ваших предложений.