JTidy Node.findBody() – 如何使用?

我正在尝试用JTidy进行XHTML DOM解析,这似乎是违反直觉的任务。 特别是,有一种解析HTML的方法:

Node Tidy.parse(Reader, Writer) 

为了获得该节点的,我认为,我应该使用

 Node Node.findBody(TagTable) 

我应该在哪里获得该TagTable的实例? (构造函数受到保护,我还没有找到工厂来生产它。)

我使用JTidy 8.0-SNAPSHOT。

我发现有简单的方法来提取身体:

 tidy = new Tidy();
 tidy.setXHTML(真);
 tidy.setPrintBodyOnly(真);

然后在Reader-Writer对上使用整洁。

应该很简单。

您可以使用parseDOM方法,这将为您提供org.w3c.dom.Document

 Document document = Tidy.parseDOM(reader, writer); Node body = document.getElementsByTagName("body").item(0);