将PDF文件转换为单个HTML文件

我正在尝试将PDF文档转换为java中的单个HTML文件。 大多数转换器在线将一个PDF文件转换为多个HTML文件。 我想将整个PDF转换为单个HTML文件。

有什么建议么?

有什么建议么?

您可能总是使用JSoup API编写一些代码来编写包含多个HTML文件中每个文件的body的单个文档。 结合样式和样式表(CSS)可能会有点棘手(特别是如果原始HTML使用’id’元素)。


虽然我发现很难相信没有一个转换器,其中“单个文档”是一个选项。 我建议进一步搜索。

我认为应该可以用itext解析你的PDF文档,然后生成你的html文件。 我必须承认我没有检查它是否可行。

您是否查看了http://www.jpedal.org/html_index.php ,其中包含一个可写入单个文件的选项。