如何使用HtmlUnit获取HTML页面

我知道你可能认为这个问题很愚蠢,但我需要使用HtmlUnit。 但是,它以XML或文本forms返回页面。

我不知道如何获得纯HTML(与浏览器返回的源代码相同)

我需要这个,因为我需要使用一些书面模块。 有任何想法吗?

您可以使用以下代码来实现目标:

WebClient webClient = new WebClient(); Page page = webClient.getPage("http://example.com"); WebResponse response = page.getWebResponse(); String content = response.getContentAsString(); 

请参阅WebResponse.html#getContentAsString()方法的javadocs 。