Tag: docx4j

Apache POI或docx4j用于处理docx文档

您认为将docx文档作为Java对象读取哪个更好?为什么? 换一种说法。 哪个库支持大多数单词标签?

而不是在docx中呈现表和其他html标记,而是使用docx4j-ImportXHTML将它们保存为纯文本

我想将HTML代码呈现给docx。 它不是渲染html(即表格格式的表格),而是简单地将html代码写为纯文本。 我使用的是docx4j-ImportXHTML jar。 我使用了这里的代码并将其修改为保存在文件中。 我究竟做错了什么? public static void xhtmlToDocx(String xhtml, String destinationPath, String fileName) { File dir = new File (destinationPath); File actualFile = new File (dir, fileName); WordprocessingMLPackage wordMLPackage = null; try { wordMLPackage = WordprocessingMLPackage.createPackage(); } catch (InvalidFormatException e) { e.printStackTrace(); } XHTMLImporterImpl XHTMLImporter = new XHTMLImporterImpl(wordMLPackage); //XHTMLImporter.setDivHandler(new DivToSdt()); //OutputStream os = […]

使用docx4j进行docx比较时出现OutOfMemoryError

在我的应用程序中,我正在比较两个docx文件并创建一个html比较文件,当我尝试使用150或170行以下的文件然后没有问题,而我尝试比较像200行或更多的大文件然后那个时间显示了 java.lang.OutOfMemoryError: Java heap space error, 任何人都可以帮忙吗?

将HTML转换为DOCX

我的问题非常具体,我希望有人从HTML到DOCX进行了这种转换。 为此,我从github获取了一个示例代码,并在我的本地Eclipse安装程序中尝试了它。 import java.io.File; import java.io.FileNotFoundException; import javax.xml.bind.JAXBException; import org.docx4j.convert.in.xhtml.XHTMLImporterImpl; import org.docx4j.openpackaging.exceptions.Docx4JException; import org.docx4j.openpackaging.exceptions.InvalidFormatException; import org.docx4j.openpackaging.packages.WordprocessingMLPackage; import org.docx4j.openpackaging.parts.WordprocessingML.NumberingDefinitionsPart; public class HtmlToDocConvert { /** * @param args * @throws FileNotFoundException * @throws JAXBException * @throws Docx4JException */ public static void main(String[] args) throws FileNotFoundException, JAXBException, Docx4JException { // TODO Auto-generated method stub // File file = […]

使用Java将docx文件转换为PDF

我正在寻找一些“稳定”的方法将DOCX文件从MS WORD转换为PDF。 从现在开始我已经将OpenOffice作为监听器使用,但它经常挂起。 问题是我们遇到许多用户想要同时将SXW,DOCX文件转换为PDF的情况。 还有其他可能吗? 我尝试了这个网站的例子: https : //angelozerr.wordpress.com/2012/12/06/how-to-convert-docxodt-to-pdfhtml-with-java/但输出结果不好(转换后的文件)有错误和布局相当修改)。 这是“源”docx文档: 这里是用docx4j转换的文档,文档中有一些exception文本。 此外,右上角的文字也丢失了。 这个是使用OpenOffice创建的PDF,从docx转换为pdf。 有些文字缺少“右上角” 是否有其他选项将docx转换为PDF格式的pdf?