Tag: docx4j

Apache POI或docx4j用于处理docx文档: 您认为将docx文档作为Java对象读取哪个更好？为什么？换一种说法。哪个库支持大多数单词标签？

而不是在docx中呈现表和其他html标记，而是使用docx4j-ImportXHTML将它们保存为纯文本: 我想将HTML代码呈现给docx。它不是渲染html（即表格格式的表格），而是简单地将html代码写为纯文本。我使用的是docx4j-ImportXHTML jar。我使用了这里的代码并将其修改为保存在文件中。我究竟做错了什么？ public static void xhtmlToDocx(String xhtml, String destinationPath, String fileName) { File dir = new File (destinationPath); File actualFile = new File (dir, fileName); WordprocessingMLPackage wordMLPackage = null; try { wordMLPackage = WordprocessingMLPackage.createPackage(); } catch (InvalidFormatException e) { e.printStackTrace(); } XHTMLImporterImpl XHTMLImporter = new XHTMLImporterImpl(wordMLPackage); //XHTMLImporter.setDivHandler(new DivToSdt()); //OutputStream os = […]

使用docx4j进行docx比较时出现OutOfMemoryError: 在我的应用程序中，我正在比较两个docx文件并创建一个html比较文件，当我尝试使用150或170行以下的文件然后没有问题，而我尝试比较像200行或更多的大文件然后那个时间显示了 java.lang.OutOfMemoryError: Java heap space error, 任何人都可以帮忙吗？

将HTML转换为DOCX: 我的问题非常具体，我希望有人从HTML到DOCX进行了这种转换。为此，我从github获取了一个示例代码，并在我的本地Eclipse安装程序中尝试了它。 import java.io.File; import java.io.FileNotFoundException; import javax.xml.bind.JAXBException; import org.docx4j.convert.in.xhtml.XHTMLImporterImpl; import org.docx4j.openpackaging.exceptions.Docx4JException; import org.docx4j.openpackaging.exceptions.InvalidFormatException; import org.docx4j.openpackaging.packages.WordprocessingMLPackage; import org.docx4j.openpackaging.parts.WordprocessingML.NumberingDefinitionsPart; public class HtmlToDocConvert { /** * @param args * @throws FileNotFoundException * @throws JAXBException * @throws Docx4JException */ public static void main(String[] args) throws FileNotFoundException, JAXBException, Docx4JException { // TODO Auto-generated method stub // File file = […]

使用Java将docx文件转换为PDF: 我正在寻找一些“稳定”的方法将DOCX文件从MS WORD转换为PDF。从现在开始我已经将OpenOffice作为监听器使用，但它经常挂起。问题是我们遇到许多用户想要同时将SXW，DOCX文件转换为PDF的情况。还有其他可能吗？我尝试了这个网站的例子： https ： //angelozerr.wordpress.com/2012/12/06/how-to-convert-docxodt-to-pdfhtml-with-java/但输出结果不好（转换后的文件）有错误和布局相当修改）。这是“源”docx文档：这里是用docx4j转换的文档，文档中有一些exception文本。此外，右上角的文字也丢失了。这个是使用OpenOffice创建的PDF，从docx转换为pdf。有些文字缺少“右上角” 是否有其他选项将docx转换为PDF格式的pdf？