在谷歌搜索单词,并希望使用java程序找到每个单词的命中

我有30000个字典单词。 在那里我想搜索谷歌中的每个单词,并希望使用Java程序找到每个单词的命中。 可能吗?

使用Google的SOAP搜索API查找 。 不过,您每天最多只能查询1000次。 如果您使用他们的AJAX API,则会删除此限制。

由于你的重复post已经关闭,我也会在这里发布我的答案:

这是否可能并不重要:谷歌不希望你这样做。 他们有一个公共AJAX搜索API开发人员可以使用: http : //code.google.com/apis/ajaxsearch/web.html

这是一个关于从URLConnection读取和写入的Sun教程。

我可以看到进行Google搜索的最简单的url如下:

http://www.google.com/#q=wombat

使用java从url读取非常简单。 基本工作示例如下

 public Set readUrl(String url) { String line; Set lines = new HashSet(); try { URL url = new URL(url); URLConnection page = url.openConnection(); BufferedReader in = new BufferedReader( new InputStreamReader(page.getInputStream())); while ((line = in.readLine()) != null) { lines.add(line); } } catch (MalformedURLException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } return lines; } 

我建议将你的问题分成几部分。 让每个人都工作,然后将他们结合在一起,以获得您想要的解决方案。

你有几件事情在这里:

  1. 从URL下载文本
  2. 扫描一串字符并将其分解为单词
  3. 迭代一个单词列表并计算你的字典中的命中数

计算机科学就是要解决大问题并将它们分解成较小的问题。 我建议你现在开始学习如何做到这一点。