Программа для распознавания голоса через Yandex SpeechKit API
Здравствуйте!
Требуется написать программу для пакетного распознавания аудиофайлов через Yandex SpeechKit API:
https://cloud.yandex.ru/services/speechkit#demo
https://skr.sh/i/120921/W6KN6ABh.jpg
С предварительной нарезкой аудио дорожки на фрагменты и их отправкой в сервис Yandex SpeechKit API для распознавания.
Запись распознанного текста производим в TXT-файлы, с форматированием по тайм-кодам в формате:
*тайм-код 1*
Фрагмент текста 1 ...
*тайм-код 2*
Фрагмент текста 2 ...
*тайм-код 3*
Фрагмент текста 3 ...
И т.д.
1. Перед запуском программы прописываем в настройках путь к папке с входными аудиофайлами и ключ API для Yandex SpeechKit API.
2. Запускаем программу.
3. Программа нарезает аудиофайлы на фрагменты по 1 минуте для распознавания и отправляет их в Yandex SpeechKit API.
4. Распознанный текст пишем в файлы TXT, с форматированием по тайм-кодам, во вложенную папку TXT (на том же уровне, где лежат аудиофайлы) с именами исходных аудиофайлов.
5. Выводим индикацию процесса: какой файл распознается в данный момент и какой процент файла обработан.