Нужно на базе своего или фришного движка типа Sphinx, HTK, Julius, Kaldi
сделать распознование 10 слов произносимых разными людьми с разной скоростью и интонацией.
Ос Linux, звук в mp3 файле (по 3-5 слов)
Образцы файлов для создания эталонов предоставлю.