Перевести и анализировать твиты в xlsx формате с помощью VaderSentimen
Нужно перевести твиты в формате xlsx c испанского/итальянского на английский (через Google Translate и Python) и прогнать через алгоритм анализа эмоционального оттенка VADER Sentiment Analysis. Этот анализ показывает какие эмоции выражает язык используемый в твитах – позитивные, нейтральные или негативные и дает оценку каждому параметру.
Для этого уже есть инструмент на Python Packages – VADER Sentiment Analysis Multilanguage который автоматически переводит и дает значение для каждого твита. То есть задача состоит в том чтобы правильно прогнать файлы через этот анализ и получить значения. Анализ сам open source так что все ресурсы есть онлайн.
Результат должен быть xlsx файл с определенными колонками (дата, оригинальный твит, перевод твита (англ.), позитивная оценка, нейтральная оценка, негативная оценка, абсолютная величина, и автор).
Для работы не нужно знание языков или детальное знание самого анализа – нужно знание Python. Очень важно правильно сохранить последовательность данных и какое значение подходит к какому твиту. Я могу проверить во время и после завершения, перевод и правильность значений.
Этот проект будет использован для академической работы.
Приложенные файлы: Italian Tweets.xlxs (Итальянские твиты), Spanish Tweets xlsx (Испанские твиты) и файл с примером, ресурсами и инструкцией.