📌 Цель:

Обеспечить корректную работу голосовых команд, воспроизведения аудиофайлов и взаимодействия с backend-частью, устранить текущие баги, проверить весь поток.

🛠 Технологический стек:

Frontend: HTML + JavaScript (в том числе Web Speech API)

Backend: Python (Flask)

📋 Функциональное описание:

Приложение позволяет пользователю (в том числе через голос) запрашивать:

🔊 воспроизведение аудиофайла из заранее подготовленной коллекции (сказки, песни и др.);

🧠 взаимодействие с ChatGPT через распознанную голосовую команду (STT → GPT → TTS).

🔧 Задачи на исправление

1. Ошибка воспроизведения аудиофайлов

Описание: При попытке воспроизведения любого аудиофайла (например, сказки) кнопка Play не работает.

Ожидаемый результат: По нажатию кнопки происходит воспроизведение соответствующего файла.

2. Ошибка передачи распознанной речи

Описание: Голос успешно распознаётся в браузере (видно в консоли), но текст не отправляется на сервер.

Ожидаемый результат: Распознанная команда (например, "Lulla, расскажи сказку про волка") передаётся на backend, где обрабатывается и возвращается соответствующий результат (аудиофайл).

3. Финальное тестирование всей цепочки

Проверить, что:

Микрофон активируется;

Речь распознаётся;

Команда отправляется на сервер;

Сервер возвращает аудиофайл;

Аудиофайл воспроизводится.

💬 Дополнительные условия

Поддержка всех предусмотренных языков (11 языков).

Поддержка всех вариантов ключевого слова активации: lulla, lulu, lula и т.п.

Голосовая логика активируется только при наличии ключевого слова или при явном нажатии кнопки (например, “Поговорить с Луллой”).

16 часов назад
Гость
17 часов в сервисе
Был
5 часов назад

Заявки фрилансеров

Павел
 
26 лет
3 дня в сервисе
онлайн
15 часов назад
Никита
 
19 лет
2 года в сервисе
Был
10 часов назад
1 отзыв(-1)
15 часов назад
Пётр
 
40 лет
2 дня в сервисе
Был
19 минут назад
16 часов назад