Всем привет.Существует очень интересная задача, по созданию голоса из текста и редактированию одинаковых по структуре аудиодорожек по эталону.Аудио дорожки создаются нейронной сетью по тексту, причем текст переводится на разные языки, например - оригинал на русском, а еще переводится текст на английский и испанский, поэтому дикторы говорят несколько по разному.Необходимо создать ПО, которое бы позволил делать следующее: - взаимодействовать с внешней БД (гугл-таблицей); - взаимодействовать с API генераторов голоса (Microsoft, Google, Yandex и Zvukogram); - править на уровне исходника лишние паузы; - делать на уровне исходника паузы между сегментами; - делать подгонку аудио дорожек подражателей под эталон; - делать проверку правильности структуры аудио дорожек подражателей; - стабилизировать скорость аудиоряда под эталон, согласно понятного скрипта; - стабилизировать скорость сегмента аудио ряда под эталон; - получать обработанные (исправленные) аудио дорожки подражатели в нужную папку.Бюджет на задачу: 27 000 рублей.Оплата происходит через данный фриланс-сайт, комиссию беру на себя.Подробное ТЗ можно почитать тут:docs.google.com/document/d/1sXKIQZrqagsGIg6g_GPUP7nN434vMm7KKNFrMVjYCeA

2 года назад
guest_16780983995317
2 года в сервисе
Был
2 года назад

Заявки фрилансеров

Тимофей
 
21 год
3 года в сервисе
Был
5 месяцев назад
2 года назад