语音到文本:单独播放MP3信息并检索单词

我有很少的MP3文件是演讲。 我之前使用过Android Speech to Text,所以我知道它可以存储口语。 有什么方法可以从MP3中获取所说的单词并将其显示在EditText吗?

我正在考虑默默播放MP3并识别单词,但不知道如何做到这一点。 我正在使用谷歌语音引擎。

没有本地方法可以将包含口语单词的音频文件转换为Android上的文本。 您需要使用第三方API来执行此操作,例如。

  1. Nuance的
  2. iSpeech

也许Pocket Sphinx ,虽然您可能必须自己编写文件输入流方面。

如果您不关心违反条款和条件,可以使用Chrome Speech API 。