如何从Java中的HTML文件中获取值?
我需要从HTML文件中获取一个值(下面的示例中为“abc”),如下所示:
正如我从其他post中发现的那样,我应该使用其中一个HTML解析器(而不是正则表达式)。 你能告诉我使用哪一个或显示代码示例。
谢谢。
你可以使用Jsoup 。
File file = new File("/path/to/file.html"); Document document = Jsoup.parse(file, "UTF-8"); Element something = document.select("input[name=something]").first(); String value = something.val(); System.out.println(value); // abc // ...
或更短:
String value = Jsoup.parse(new File("/path/to/file.html"), "UTF-8").select("input[name=something]").first().val(); System.out.println(value); // abc // ...
也可以看看:
- 领先的Java HTML解析器的优缺点是什么?
看看http://htmlparser.sourceforge.net/