如何从Java中的HTML文件中获取值?

我需要从HTML文件中获取一个值(下面的示例中为“abc”),如下所示:

 

正如我从其他post中发现的那样,我应该使用其中一个HTML解析器(而不是正则表达式)。 你能告诉我使用哪一个或显示代码示例。

谢谢。

你可以使用Jsoup 。

 File file = new File("/path/to/file.html"); Document document = Jsoup.parse(file, "UTF-8"); Element something = document.select("input[name=something]").first(); String value = something.val(); System.out.println(value); // abc // ... 

或更短:

 String value = Jsoup.parse(new File("/path/to/file.html"), "UTF-8").select("input[name=something]").first().val(); System.out.println(value); // abc // ... 

也可以看看:

  • 领先的Java HTML解析器的优缺点是什么?

看看http://htmlparser.sourceforge.net/