Java URL – 谷歌翻译请求返回403错误?

我正在创建一个Java控制台应用程序,需要向Google Translate发送HTTP请求以从上述站点获取翻译。

我的问题是,当我尝试使用openStream()尝试从有效的URL读取时,我收到403错误。

使用Translator t = new Translator();创建此Translator类的实例Translator t = new Translator(); 并调用t.translate("en", "ja", "cheese"); 例如,应该返回程序在http://translate.google.com/#en|ja|che页面上找到的翻译,但它会捕获IOException并返回:

http://translate.google.com/#en|ja|cheese Server returned HTTP response code: 403 for URL: http://translate.google.com/#en|ja|cheese

创建有效Google翻译url的任何其他参数也会出现类似的错误。

403错误显然意味着我被拒绝许可。 这就是我想知道的。 为什么我无法访问此页面,以及我必须执行哪些操作才能访问此页面?

我在我的网络浏览器中访问了该网站,并手动输入了我的程序尝试访问的地址,但它有效; 我不确定为什么我的程序无法访问该页面? 将地址键入或复制/粘贴到我的FireFox导航栏中可以正常工作; 看,如果这是正确的,那么该网站可能希望我通过另一个页面上的链接访问该页面? 我怎么可能这样做 ,如果这是我必须做的?

这是代码,因为我认为它可能会有所帮助..当我尝试从translationURL.openStream()返回的InputStream中的InputStreamReader创建BufferedReader时,似乎抛出exception:

 import java.io.*; import java.net.*; public class Translator { private final String googleTranslate = "http://translate.google.com/#"; public String translate( String from, String to, String item ) { String translation = googleTranslate + from + '|' + to + '|' + item; URL translationURL; try { translationURL = new URL(translation); } catch(MalformedURLException e) { return e.getMessage(); } BufferedReader httpin; String fullPage = ""; System.out.println(translation); try { httpin = new BufferedReader( new InputStreamReader(translationURL.openStream())); String line; while((line=httpin.readLine()) != null) { fullPage += line + '\n'; } httpin.close(); } catch(IOException e) { return e.getMessage(); } int begin = fullPage.indexOf(""); int end = fullPage.indexOf(""); return fullPage.substring(begin + 15, end); } public Translator() {} } 

我正在Ubuntu Linux 11.04上的Eclipse(GALILEO)中测试此代码,该代码与Wubi一起安装,具有可靠且可靠的无线Internet连接。 我也试过在命令行中运行它,但行为是一样的。 java -version让我这样:

java version "1.6.0_22" OpenJDK Runtime Environment (IcedTea6 1.10.2) (6b22-1.10.2-0ubuntu1~11.04.1) OpenJDK 64-Bit Server VM (build 20.0-b11, mixed mode)

他们正在查看用户代理字符串,并且可能他们不希望人们以编程方式执行此操作。

我确实让您的代码正常工作,但由于Google收取API访问费用,并且他们主动阻止不是浏览器的内容(基于用户代理字符串),我不会告诉您我是如何做到的。

谷歌搜索在Java中设置用户代理字符串将获得你想要的(事实上我在Stackoverflow上找到了答案)。

通过告诉我我是浏览器而不是正在运行的代码来欺骗“translate.google”。

 URLConnection conn = url.openConnection(); // fake request coming from browser conn.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows; U; Windows NT 6.1; en-GB; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13 (.NET CLR 3.5.30729)"); 

添加referer请求

  URL translateURL = new URL(url); HttpURLConnection connection = (HttpURLConnection) translateURL .openConnection(); connection.setDoOutput(true); connection.setRequestProperty("X-HTTP-Method-Override", "GET"); connection.setRequestProperty("referer", "accounterlive.com");