Jsoup选择并迭代所有元素

我将通过jsoup连接到一个url并获取它的所有内容但是如果我选择喜欢,

doc.select("body") 

它返回一个元素,但我想获取页面中的所有元素并逐个迭代它们,例如,

  Test  

Hello All

Second Page
Test

如果我选择使用body,我会将结果放在一行中,如:

 Test Hello All Second Page Test 

相反,我想选择所有元素并逐个迭代并产生结果,如,

 Test Hello All Second Page Test 

使用jsoup会有可能吗?

谢谢,
KARTHIK

您可以使用*选择器选择文档的所有元素,然后使用Element#ownText()单独获取每个Element#ownText()文本。

 Elements elements = document.body().select("*"); for (Element element : elements) { System.out.println(element.ownText()); } 

使用jsoup库获取文档正文中的所有元素。

doc.body().children().select("*");

获取文档正文元素中的第一级元素。

doc.body().children();

您可以使用XPath或任何包含XPath的库

表达式是//text()

在这里使用xml测试表达式