Голосовое управление

Леонид18 дней в сервисе
Данные заказчика будут вам доступны после подачи заявки
16.05.2026

Автономная C++ библиотека, которая принимает голосовые команды на русском языке через микрофон и транслирует их в вызовы методов зарегистрированных устройств.

Работает полностью офлайн — ни одного обращения к интернету.

В качестве STT рассматривается whisper.cpp модели small.

LLM желательно использовать Phi-3-mini-4k Q4

TTS не критичен, главное получить нормальный голос и связанную речь.
Основная задача библиотеки превратить голосовые команды в конкретные значения и передать уже устройству через специальный интерфейс.
Надо учесть, что управляющий -обычный человек, может не правильно выговорить какие-то слова или как-то проявить "остроумие".
Требуется специалист со знанием особенностей LLM и с опытом работы.

Проект кроссплатформенный, требуются сборки для Windows 11 и Debian 12

Целевая машина: Intel N100 без GPU

Заявки фрилансеров