JTidy Node.findBody() – 如何使用?
我正在尝试用JTidy进行XHTML DOM解析,这似乎是违反直觉的任务。 特别是,有一种解析HTML的方法:
Node Tidy.parse(Reader, Writer)
为了获得该节点的,我认为,我应该使用
Node Node.findBody(TagTable)
我应该在哪里获得该TagTable的实例? (构造函数受到保护,我还没有找到工厂来生产它。)
我使用JTidy 8.0-SNAPSHOT。
我发现有更简单的方法来提取身体:
tidy = new Tidy(); tidy.setXHTML(真); tidy.setPrintBodyOnly(真);
然后在Reader-Writer对上使用整洁。
应该很简单。
您可以使用parseDOM
方法,这将为您提供org.w3c.dom.Document
:
Document document = Tidy.parseDOM(reader, writer); Node body = document.getElementsByTagName("body").item(0);