如何将Jsoup(Java html解析器)中生成的文档转换为字符串
我有一个在jsoup中制作的文档,看起来像这样
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
如何将该doc
转换为字符串。
你有没有尝试过:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); String htmlString = doc.toString();
当Document扩展Element时,它还有根据API获取的方法html() “检索元素的内部HTML”。 这应该工作:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); String htmlString = doc.html();
附加信息:
每个Document对象都有一个对内部类Document.OutputSettings实例的引用,可以通过Document的outputSettings()方法访问它。 在那里,您可以使用setter prettyPrint(true / false)启用/禁用漂亮打印。 有关详细信息,请参阅文档和Document.OutputSettings的API
doc.toString()
和doc.outerHtml()
。
- Elements post = d.select(“div.post-content”);
- String dd = post.toString();
- 文件ddd = Jsoup.parse(dd);
在将字符串解析为文档之后,您可以使用它来处理文档function
- Elements scriptTag = ddd.getElementsByTag(“script”);
- 的System.out.println(scriptTag);