如何使用Jsoup提取单独的文本节点?
我有这样一个元素:
TextA
TextB
如何单独提取TextA和TextB?
几种方式。 这实际上取决于文档本身以及给定的HTML标记是否一致。 在这个特定的例子中,您可以通过Element#childNodes()
获取td
的子节点,然后单独测试每个节点是否为TextNode
。
例如
Element td = getItSomehow(); for (Node child : td.childNodes()) { if (child instanceof TextNode) { System.out.println(((TextNode) child).text()); } }
结果
TEXTA TEXTB
我认为,如果Jsoup提供了一个Element#textNodes()
或其他东西来获取子文本节点,就像Element#children()
那样获取子元素(这会在示例中返回
元素) )。