如何将Jsoup(Java html解析器)中生成的文档转换为字符串

我有一个在jsoup中制作的文档,看起来像这样

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); 

如何将该doc转换为字符串。

你有没有尝试过:

 Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); String htmlString = doc.toString(); 

Document扩展Element时,它还有根据API获取的方法html() “检索元素的内部HTML”。 这应该工作:

 Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); String htmlString = doc.html(); 

附加信息:

每个Document对象都有一个对内部类Document.OutputSettings实例的引用,可以通过Document的outputSettings()方法访问它。 在那里,您可以使用setter prettyPrint(true / false)启用/禁用漂亮打印。 有关详细信息,请参阅文档Document.OutputSettings的API

doc.toString()doc.outerHtml()

  1. Elements post = d.select(“div.post-content”);
  2. String dd = post.toString();
  3. 文件ddd = Jsoup.parse(dd);

在将字符串解析为文档之后,您可以使用它来处理文档function

  1. Elements scriptTag = ddd.getElementsByTag(“script”);
  2. 的System.out.println(scriptTag);
Interesting Posts