如何在Android上使用Google的中文字符文字转语音服务?

我正试图从谷歌的文字转语音function中提取音频文件。 基本上,你抛出链接,然后在结束时连接任何你想说的话。 我已经得到了下面的代码,可以很好地用于英语,所以我认为问题必须是如何在请求中对汉字进行编码。 这是我得到的:

String text = "text to be spoken"; public static final String AUDIO_CHINESE= "http://www.translate.google.com/translate_tts?tl=zh&q="; public static final String AUDIO_ENGLISH = "http://www.translate.google.com/translate_tts?tl=en&q="; URL url = new URL(AUDIO_ENGLISH + text); urlConnection = (HttpURLConnection) url.openConnection(); urlConnection.setRequestMethod("GET"); urlConnection.setRequestProperty("Accept-Charset", Variables.UTF_8); if (urlConnection.getResponseCode() ==200) { //get byte array in response in = new DataInputStream(urlConnection.getInputStream()); } else { in = new DataInputStream(urlConnection.getErrorStream()); } //use commons io byte[] bytes = IOUtils.toByteArray(in); in.close(); urlConnection.disconnect(); return bytes; 

但是,当我尝试使用中文字符时,它会返回一些我无法在媒体播放器中播放的东西(我怀疑它不是一个合适的音频文件,因为绝大多数字节都是’85’)。 所以我试过了两个

 String chText = "你好"; URL url = new URL(AUDIO_CHINESE + URLEncoder.encode(chText, "UTF-8)); 

 URL url = new URL(AUDIO_CHINESE + Uri.encode(chText, "UTF-8")); 

然后添加

 urlConnection.setRequestProperty("content-type", "application/x-www-form-urlencoded; charset=UTF-8"); 

到请求标头。 这只是让它变得更糟,因为现在它甚至没有返回200代码,而是在logcat中声明“FileNotFound”。

所以一时兴起,我回去尝试使用英文文本的URL / Uri编码,现在英文也不会返回有效的结果。 不确定这里发生了什么:如果我复制并粘贴到Chrome中,调试器中的原始URL工作正常,但由于某种原因,urlConnection不起作用。 觉得我错过了一些明显的东西。

编辑

摆弄它更多的人没有回答,只是更多的混乱(和愤怒)。 出于某种原因,当通过httpurlconnection发送时,Google tts机器将utf-8%编码的文本读取为utf-16,至少就我所知。 例如,字符“维”(wei2)是%E7%B6%AD ,但是如果你通过连接传递它,你将得到一个发音为“see”的文件(准确地说是“ç”)。

事实certificate,UTF-16中的0x00E7 (其utf-8%编码版本为%C3%A7 )。 我不知道它为什么在Java中这样做,因为在任何浏览器中将适当的%放在链接的末尾都能正常工作。 到目前为止,我已经尝试了各种组合,试图让tts读取整个%E7%B6%AD而没有太大的成功。

EDIT2

找到我的问题的解决方案! 请参阅下面的答案。 问题不在于编码,而是在谷歌的解析中。 已相应编辑了标题。 干杯!

所以,事实certificate,最后的问题根本不是编码; 这是Google最终的处理。 要使服务正确识别UTF-8,您需要使用此链接http://www.translate.google.com/translate_tts?ie=utf-8&tl=zh-cn&q=而不是上述链接。 注意ie=utf-8添加到参数中。 所以你可以只使用URLEncoder.encode("你好嗎", "UTF-8") ,将它附加到链接,并按照惯例发送它。 呼!