Tag: 语音到文本

如何在Android应用程序的语音识别中传递语言?

我一直在研究Android中的语音识别API,发现语音设置改变时语音结果会有所不同,有没有办法以编程方式设置它? 或者是否打算在语音设置屏幕上午餐? 或者还有什么? 注意:我试图使用这个额外的意图: intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_PREFERENCE, “en-US”); 和 Intent detailsIntent = new Intent(RecognizerIntent.ACTION_GET_LANGUAGE_DETAILS); sendOrderedBroadcast(detailsIntent, null, new LanguageDetailsChecker(), null, Activity.RESULT_OK, null, null);

如何使用CMU Sphinx 4将语音转换为带有英语voxforge模型的文本

我正在试图弄清楚如何使用sphinx4或pocketsphinx与英国voxforge模型,但我不能让它工作。 我试过阅读doc页面(比如这个http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html ),但它对我没有帮助。 我想要的是一个可执行文件,我可以在其中指定要使用的模型和要用作源的音频文件,并将可执行文件打印出来,最好猜测录制内容的声音。 我喜欢运气:pocketsphinx_continuous -infile recording.wav 2> / dev / null 但它会在转录完整的音频文件之前中止,并且默认模型可以通过几个单词来创建音频中的可读文本。 我已经编译并测试了sphinx4源程序包中的演示,但所有示例似乎都只有很少的单词,并且需要一个模型来使用voxforge对我有用。 我怎么设置它?