
Построить систему транскрипции голоса из видео и аудио потоков в текст
Построить систему транскрипции голоса из видео и аудио потоков в текст
Входные данные: Видео и Аудио файлы, из соц. сетей ФБ, Ютуб, инстаграмм, ВК, твиттер, радио и ТВ.
Скорость работы: скорость перевода аудио-видео дорожек в текст 10 000 файлов в час. (длина файла до 10 мин.)
Выходные данные: транскрипция текста
Необходимые данные:
id и наименование пользователя
id и наименование сообщества
id и наименование автора
текст публикации
ссылка на публикацию
кол-во репостов
кол-во лайков
кол-во комментарии
дата публикации
дата сбора данных.
Требования к системе:
Проверка и обогащение 100 000 (сто тысяч) профилей в течении одного часа
Язык программирования Python
Оптимальное расходование серверных мощностей
Возможность горизонтального масштабирования системы
Взаимодействие с внешней системой RestAPI
Читабельный код
Документирование кода
Документация к системе
*Серверные мощности будут предоставлены.
Сроки и этапы работ:
1. Разработка (1-2 месяца)
2. Внедрение (1-2 недели)
3. Сопровождение (3 месяца)
Заявки фрилансеров

