Здравствуйте, Уважаемые! Ставьте свои ставки и сроки. Предварительно. Задавайте вопросы.
Необходима помощь в доработке голосового ассистента на Python
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Нужно улучшить работу передачи аудио файлов с сервера к клиенту (использую модуль socket для создания сервера.
Работа сервера:
На сервере преобразую текст(ответ голосового ассистента) в речь с помощью модуля torch(на нём запускается заранее натренированная нейросеть из интернета по преобразованию текста в речь), после того как получу: audio- переменная с аудио, подготавливаю ее к отправке к клиенту: audio=dumps(audio)- делаю это с помощью модуля pickle(from pickle import dumps), затем отсылаю переменную с аудио к клиенту (client_socket.sendall(audio))- перед отправкой, отправляю клиенту размер аудиопеременной (client_socket.sendall(bytes(f'{str(len(audio))', 'utf-8')) )
Работа клиента:
Клиент принимает информацию о размере переменной с аудио (size=client.recv(1024).decode('utf-8')), затем клиент получает аудиопеременную (audio=client.recv(int(size))) и преобразует ее в аудио для озвучки (audio=loads(audio)), используя- from pickle import loads, затем он все это воспроизводит с помощью- from sounddevice import play, stop (play(audio, 50000))
Проблема:
Все работает, но довольно часто выскакивает ошибка: pickle data was truncated 'utf-8' codec can't decode byte 0xbb in position 1: invalid start byte, на одних компьютерах эта ошибка выскакивает постоянно, на других часто, но не всегда, на третьих(в моей локальной сети) очень редко, предполагаю, что это связанно с качеством интернета и с тем, что файл довольно большого размера передается одним пакетом, а его данные повреждаются, что и приводит к ошибке, указанной выше
Tакже нужно улучшить-оптимизировать модуль, срабатывающий при обращении к голосовому ассистенту по имени(сейчас голосовой ассистент слушает речь(по предложениям), предложения определяются по паузам в речи, затем ищет свое имя в предложении, если он его находит, то подает запрос на сервер.
Необходимо, чтобы ассистент(модуль по преобразованию речи в текст) срабатывал при тригере(обращении к нему по имени), а после этого начинал уже слушать остальной текст. То есть ассистент должен начинать обработку речи(перевод речи в текст) только после того, как услышит тригер(обращении к нему по имени), для преобразования речи в текст я использую модуль PyAudio и Vosk(заранее натренированная нейросеть из интернета)
- Похожие заказы
- $15Прикладное ПО1 исполнительЗавершен4 месяца назад
#Shopify #AppDevelopment #FreelanceJob #Hire #Ищу #Шопифай #ShopifyApp Должность: Разработчик приложений Shopify (Проектная работа) Местоположение: Удаленная работа Обзор проекта: Мы ищем опытного разработчика приложений Shopify для работы над проектом. Проект включает ...
Прикладное ПО3 заявкиЗакрыт4 месяца назадАвтоматизировать извлечение заданных химических элементов из предоставленного корпуса. Совпадения следует возвращать в том порядке, в котором они указаны в корпусе. Результирующий DataFrame должен содержать соответствующие совпадения, где это применимо, для всех химических элементов (см. прикрепленный ...
Прикладное ПО9 заявокЗакрыт4 месяца назадРазрабатываем сервис для построения и расшифровки натальных карт. Нужно разработать Построение и ОБЩЕЕ толкование натальной карты Построение и толкование натальной карты по выбранному периоду: на день, месяц, год. Будет очень уместно использовать ...
Прикладное ПО4 заявкиЗакрыт4 месяца назад- $200
Нужно одну штуку проделать, интегрировать gpt в тиндер, вот инструкция: https://www.explainthis.io/en/ai/tinder Нам надо что бы ИИ общался с парнями от лица модели. + что бы перечитывал всю переписку что бы ...
Прикладное ПО5 заявокЗакрыт4 месяца назад Требуется разработка и внедрение CRM системы для организации управления сделок на основе входящих писем от клиентов. В основном коммуникация с заказчиками строится на email переписке, поэтому требуется рабочий почтовый сервер (не такой как в битрикс24, ...
Прикладное ПО4 заявкиЗакрыт4 месяца назадПортування програми з Qt 4 на Qt 6
Прикладное ПО1 заявкаЗакрыт4 месяца назадсистема, состоящая из пяти основных сервисов, взаимодействующих между собой и с внешними акторами – клиентом и водителем. 1. Client Service – сервис, который обрабатывает запросы клиента, включая создание, получение и управление информацией о поездках. Использует Kafka ...
Прикладное ПО3 заявкиЗакрыт4 месяца назад- $100
Разработка телеграмм бота для знакомств.
Прикладное ПО6 заявокЗакрыт5 месяцев назад Нужно создать продукт, который будет из нашей базы аккаунтов Телеграм ставить реакции на новые посты которые вышли в канале 1) Это продукт для личного использования, будут свои тг аккаунты,и с них проставлять реакции ...
Прикладное ПО8 заявокЗакрыт4 месяца назад