如何使用Jsoup提取单独的文本节点？

我有这样一个元素：

 TextA 
 TextB

如何单独提取TextA和TextB？

几种方式。这实际上取决于文档本身以及给定的HTML标记是否一致。在这个特定的例子中，您可以通过Element#childNodes()获取td的子节点，然后单独测试每个节点是否为TextNode 。

例如

 Element td = getItSomehow(); for (Node child : td.childNodes()) { if (child instanceof TextNode) { System.out.println(((TextNode) child).text()); } }

结果

  TEXTA 
  TEXTB

我认为，如果Jsoup提供了一个Element#textNodes()或其他东西来获取子文本节点，就像Element#children()那样获取子元素（这会在示例中返回元素））。

网页抓取，屏幕抓取，数据挖掘技巧？
使用java代码获取完整的网页
使用Jsoup解析Html时出错
Jsoup Java HTML解析器：执行javascript事件
通过jSoup从Div标签获取属性值
使用htmlunit -Java访问Javascript生成的html

如何使用Jsoup提取单独的文本节点？

如何使用JAVA从html页面获取表格

单击按钮以使其可见后解析HTML表

当apache.httpclient能够获取内容时，JSoup.connect会抛出403错误

使用XPath包含Java中的HTML

Jsoup div 语法有效，而div.class语法没有 – 为什么？

如何解析包含Javascript的网页？

如何将HTML内容转换为PDF而不会丢失使用Java的格式？

Java：HTML解析

用于读取javascript生成内容的java html解析器

从Div标签获取文本