Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Платформа: Windows или Mac.В этом проекте можно использовать любую существующую библиотеку или алгоритмы с открытым исходным кодом, если необходимо. На самом деле, как раз предпочтительнее использовать готовое (но открытое или бесплатное) для оптимизации работы.

Инструменты: Python, C ++, C #, любые. 

Главное - предоставить закомментированные исходники в дальнейшем.

Реализация аудиоанализа

Шаг 1. Создайте алгоритм (драйвер?), чтобы разделить поток звука от 2 микрофонов на несколько потоков для одновременного анализа в реальном времени с помощью различного программного обеспечения. Подготовьте плеер, который позволит использовать не только вход в режиме реального времени, но и записи разговоров для дальнейшего использования описанных ниже программных модулей распознавания голосов, анализа тона и настроения.

Шаг 2. Извлечение паттернов голоса (шаг, частота, продолжительность, время начала), предоставляемые pyAudioAnalysis ИЛИ другими алгоритмами с открытым исходным кодом, например

http://www.fon.hum.uva.nl/praat/

Шаг 3. Разделение говорящих людей (спикеров). При необходимости используйте машинное обучение.

Рекомендации:

https://arxiv.org/abs/1710.10468pyAudioAnalysis

https://blog.mozilla.org/blog/2017/11/29/announcing-the-initial-release-of-mozillas-open-source-speech-recognition-model-and-voice-dataset/

https://projets-lium.univ-lemans.fr/s4d/

Шаг 4. Визуализируйте вывод извлеченных паттернов с помощью веб-интерфейса. Создайте простой, но информативный дисплей, покажите основную информацию. На этом шаге нет предпочтений - просто быстрая демонстрация анализов осциллограмм для 2 источников (2 микрофона).

Итоги первого этапа работы:  Программное обеспечение, способное получать в реальном времени входные данные от 2 микрофонов, разделять голоса говорящих спикеров, проводить базовый анализ звука и визуализировать выходные данные на панели инструментов веб-страницы, используя диаграммы и графики.(img 1)

Эмоциональный анализ

Шаг 5. Речь в текст с использованием библиотек Kaldi или CMUSphinx. Или любых других открытых и хороших.

Шаг 6. Фильтрация ключевых слов и эмоциональная маркировка. Возможно - с использованием некоторых инструментов из этих ссылок:

https://opensource.com/business/15/7/five-open-source-nlp-tools

http://www.opener-project.eu/

Шаг 7. Формирование визуализации в реальном времени на основе этой картинки, базируясь на текстовом анализе (img 2), а так же облака эмоциональных ключевых слов (img 3).

Шаг 8.Использование открытых эмоциональных речевых баз данных в алгоритме машинного обучения для определения нейтральных, спокойных, счастливых, грустных, сердитых, страшных, удивленных и отвратительных эмоций, основанных на анализе звуковых частот.

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.98.9202&rep=rep1&type=pdf

https://semaine-db.eu/media/doc/eula.pdf

Инструменты: pyAudioAnalysis, Keras или TensorFlow.

Итоги второго этапа работы: Система, способная обнаруживать эмоциональное состояние беседы, основываясь на голосе. На приборной панели отображаются последние визуализированные ощущения и чувства как доктора, так и клиента, а также общее эмоциональное состояние данного разговора. Начать собирать метаданные, чтобы создать базу данных для предсказания результатов с помощью методов машинного обучения. Кроме того, сбор метаданных, связанных с профилем, например количество сеансов для конкретного клиента.

6 лет назад
crisalid
Валерий 
39 летРоссия
13 лет в сервисе
Был
4 года назад
  • Похожие заказы
  • Создать ПО или расширение для браузера яндекс/гугл, которое будет взаимодействовать с сайтом https://iqoption.com/ru доступы: логин: [url=mailto:[email protected]][email protected] [/url]пароль: 00isogad https://iqoption.com/traderoom Необходимо, чтобы менялась сумма ставки, в зависимости от текущего депозита в процентном соотношении и округлялось в большую сторону с окончанием "0", например 120, ...

    Прикладное ПОнет заявок
    Закрыт
    6 лет назад
  • Прошу помочь в написании ПО для конвертации эксель файла в XML для последующей загрузки в диадок и передачи через электронный документооборот в Wildberries. Обработанный файл должен проходить проверку на странице https://www.diadoc.ru/docs/forms/validation-xml и отвечать требования получателя см.файл ...

    Прикладное ПО1 исполнитель
    Завершен
    6 лет назад
  • Нужно разработать калькулятор для просчета полиграфической продукции. Их  будет три вида. Те программисты, которые уже имели опыт в разработке сложных калькуляторов , прошу помочь с этим вопросом. Я,в свою очередь готов предоставить дизайн (макет) в ...

    Закрыт
    6 лет назад
  • Нужен парсер постов (только заголовок/текст) из закрытых/открытых групп facebook. API facebook не позволяет этого делать, поэтому нужно другое решение.  Обязательно наличие опыта создания подобных проектов, а также опыт работы с facebook.

    Закрыт
    6 лет назад
  • Есть нестандартный заказ: Создаем некое дополнение на своей платформе. Раздел майнинга, где человек может собрать свой виртуальный компьютер в режиме игры и начать майнить монеты (в режиме игры). У нас есть список комплектующих, которые будут ...

    Закрыт
    6 лет назад
  • Добр день, Ув. Фрилансеры! Собственно нужно создать шаблон Zenno Poster для наполнения интернет магазина товарами. Пожалуйста указывайте сроки и стоимость за выполнение.   Спасибо! Жду ваших заявок!

    Закрыт
    6 лет назад
  • Нужен софт для определения IP адресов с открытым VNC сервером на нестандартных портах.  Желательно линукс, но не принципиально Результат софта должен быть примерно такой  1.1.1.1:45251  1.1.1.2:12221  1.1.1.3:12201

    Закрыт
    6 лет назад
  • Имеется база аудиозаписей различных интонационных конструкций (классификация Брызгуновой). На основе пакета Matlab Neural Net Pattern Recognition нужно обучить нейросеть отличать интонационных конструкции друг от друга. Дипломная работа, можно даже просто консультацию по выполнению.

    Прикладное ПОнет заявок
    Закрыт
    6 лет назад