Распознавание речи из аудио файлов

Дмитрий18 лет в сервисе

Данные заказчика будут вам доступны после подачи заявки

07.09.2021

Задача - при помощи Azure (Speech to text) и Mozilla DeepSpeech создавать стенограммы аудио файлов. На входе - файл в WAV или MP3 (перекодировка в нужный сервису формат не обязательна, но желательна), на выходе - текстовый файл с распознанным текстом. Обычно это аудио записи встреч или диктовка на английском языке, обычно 30-60 минут.

Реализация - в виде класса на C#, зависимости не важны (т.е. может использовать другие библиотеки, приложения и т.д.). Класс должен иметь выбор сервиса (Азур или Мозилла), чтобы в будущем можно было добавить сервисы Яндекс и Гугл и подключать их как альтернативные обработчики.

Распознавание речи из аудио файлов

Заявки фрилансеров