Jsoup选择并迭代所有元素
我将通过jsoup连接到一个url并获取它的所有内容但是如果我选择喜欢,
doc.select("body")
它返回一个元素,但我想获取页面中的所有元素并逐个迭代它们,例如,
Test Hello All
Second Page Test
如果我选择使用body,我会将结果放在一行中,如:
Test Hello All Second Page Test
相反,我想选择所有元素并逐个迭代并产生结果,如,
Test Hello All Second Page Test
使用jsoup会有可能吗?
谢谢,
KARTHIK
您可以使用*
选择器选择文档的所有元素,然后使用Element#ownText()
单独获取每个Element#ownText()
文本。
Elements elements = document.body().select("*"); for (Element element : elements) { System.out.println(element.ownText()); }
使用jsoup库获取文档正文中的所有元素。
doc.body().children().select("*");
获取文档正文元素中的第一级元素。
doc.body().children();
您可以使用XPath或任何包含XPath的库
表达式是//text()
在这里使用xml测试表达式