Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Нужно улучшить работу передачи аудио файлов с сервера к клиенту (использую модуль socket для создания сервера.

Работа сервера:

На сервере преобразую текст(ответ голосового ассистента) в речь с помощью модуля torch(на нём запускается заранее натренированная нейросеть из интернета по преобразованию текста в речь), после того как получу: audio- переменная с аудио, подготавливаю ее к отправке к клиенту: audio=dumps(audio)- делаю это с помощью модуля pickle(from pickle import dumps), затем отсылаю переменную с аудио к клиенту (client_socket.sendall(audio))- перед отправкой, отправляю клиенту размер аудиопеременной (client_socket.sendall(bytes(f'{str(len(audio))', 'utf-8')) )

Работа клиента:

Клиент принимает информацию о размере переменной с аудио (size=client.recv(1024).decode('utf-8')), затем клиент получает аудиопеременную (audio=client.recv(int(size))) и преобразует ее в аудио для озвучки (audio=loads(audio)), используя- from pickle import loads, затем он все это воспроизводит с помощью- from sounddevice import play, stop (play(audio, 50000))

Проблема:

Все работает, но довольно часто выскакивает ошибка: pickle data was truncated 'utf-8' codec can't decode byte 0xbb in position 1: invalid start byte, на одних компьютерах эта ошибка выскакивает постоянно, на других часто, но не всегда, на третьих(в моей локальной сети) очень редко, предполагаю, что это связанно с качеством интернета и с тем, что файл довольно большого размера передается одним пакетом, а его данные повреждаются, что и приводит к ошибке, указанной выше

Tакже нужно улучшить-оптимизировать модуль, срабатывающий при обращении к голосовому ассистенту по имени(сейчас голосовой ассистент слушает речь(по предложениям), предложения определяются по паузам в речи, затем ищет свое имя в предложении, если он его находит, то подает запрос на сервер.

Необходимо, чтобы ассистент(модуль по преобразованию речи в текст) срабатывал при тригере(обращении к нему по имени), а после этого начинал уже слушать остальной текст. То есть ассистент должен начинать обработку речи(перевод речи в текст) только после того, как услышит тригер(обращении к нему по имени), для преобразования речи в текст я использую модуль PyAudio и Vosk(заранее натренированная нейросеть из интернета)

4 месяца назад
guest_1702817526155
Беларусь
4 месяца в сервисе
Был
4 месяца назад
  • Похожие заказы
  • #Shopify #AppDevelopment #FreelanceJob #Hire #Ищу #Шопифай #ShopifyApp Должность: Разработчик приложений Shopify (Проектная работа) Местоположение: Удаленная работа Обзор проекта: Мы ищем опытного разработчика приложений Shopify для работы над проектом. Проект включает ...

    Закрыт
    4 месяца назад
  • Автоматизировать извлечение заданных химических элементов из предоставленного корпуса. Совпадения следует возвращать в том порядке, в котором они указаны в корпусе. Результирующий DataFrame должен содержать соответствующие совпадения, где это применимо, для всех химических элементов (см. прикрепленный ...

    Закрыт
    4 месяца назад
  • Разрабатываем сервис для построения и расшифровки натальных карт. Нужно разработать Построение и ОБЩЕЕ толкование натальной карты Построение и толкование натальной карты по выбранному периоду: на день, месяц, год. Будет очень уместно использовать ...

    Закрыт
    4 месяца назад
  • $200

    Нужно одну штуку проделать, интегрировать gpt в тиндер, вот инструкция: https://www.explainthis.io/en/ai/tinder Нам надо что бы ИИ общался с парнями от лица модели. + что бы перечитывал всю переписку что бы ...

    Закрыт
    4 месяца назад
  • Требуется разработка и внедрение CRM системы для организации управления сделок на основе входящих писем от клиентов. В основном коммуникация с заказчиками строится на email переписке, поэтому требуется рабочий почтовый сервер (не такой как в битрикс24, ...

    Закрыт
    4 месяца назад
  • система, состоящая из пяти основных сервисов, взаимодействующих между собой и с внешними акторами – клиентом и водителем. 1. Client Service – сервис, который обрабатывает запросы клиента, включая создание, получение и управление информацией о поездках. Использует Kafka ...

    Закрыт
    4 месяца назад
  • Нужно создать продукт, который будет из нашей базы аккаунтов Телеграм ставить реакции на новые посты которые вышли в канале 1) Это продукт для личного использования, будут свои тг аккаунты,и с них проставлять реакции ...

    Закрыт
    4 месяца назад