Tag: pdf

使用base64图像的HTML到PDF会抛出FileNotFoundException: 我正在使用itextpdf-5.0.6.jar（Java 8），当我尝试使用base64图像标记导出html代码时，我得到文件未找到exception。如果我删除图像标记一切都很好！我发现很少有关于覆盖图像标签处理器的解决方案，但是大多数都是旧的并且与5.0.6版本不兼容。这是我发送的HTML： “\n\n\n \n Test PDF\n\n\n\n \n\n \n\n\n\n\n\n\nHellow world\n” 我的代码的一部分： fileOutputStream = new FileOutputStream(file); Document document = new Document(); PdfWriter.getInstance(document, fileOutputStream); document.open(); HTMLWorker htmlWorker = new HTMLWorker(document); StringReader stringReader = new StringReader(htmlCode); htmlWorker.parse(stringReader); document.close(); fileOutputStream.close(); 任何帮助都会被感谢

IText在PDF上编辑或删除图层: H全部，我正在使用IText在PDF上添加文本图层。现在我想编辑PDF上的现有图层，图层也仅由IText创建。似乎IText没有这样的方法来支持。我想到的另一种方法是删除现有的Layer并在其位置放置新图层。 IText也不支持似乎删除。有什么办法吗？谢谢你。

使用java将多个图像添加到使用iText的单个pdf文件中: 我有以下代码，但此代码仅将最后一个图像添加到pdf中。 try { filePath = (filePath != null && filePath.endsWith(“.pdf”)) ? filePath : filePath + “.pdf”; Document document = new Document(); PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(filePath)); document.open(); // document.add(new Paragraph(“Image Example”)); for (String imageIpath : imagePathsList) { // Add Image Image image1 = Image.getInstance(imageIpath); // Fixed Positioning image1.setAbsolutePosition(10f, 10f); // Scale to new height […]

获取PDF中的确切Stringposition: 我试图读取一个流，并希望得到每个String的确切位置（坐标） int size = reader.getXrefSize(); for (int i = 0; i < size; ++i) { PdfObject pdfObject = reader.getPdfObject(i); if ((pdfObject == null) || !pdfObject.isStream()) continue; PdfStream stream = (PdfStream) pdfObject; PdfObject obj = stream.get(PdfName.FILTER); if ((obj != null) && obj.toString().equals(PdfName.FLATEDECODE.toString())) { byte[] codedText = PdfReader.getStreamBytesRaw((PRStream) stream); byte[] text = PdfReader.FlateDecode(codedText); FileOutputStream o = new […]

将PDF转换为多页tiff（第4组）: 我正在尝试将org.apache.pdfbox.pdmodel.PDDocument类和icafe库（ https://github.com/dragon66/icafe/ ）所代表的PDF转换为具有第4组压缩和300 dpi的多页tiff 。示例代码适用于我288 dpi，但奇怪的是不是300 dpi，导出的tiff仍然只是白色。有谁知道这里的问题是什么？我在示例中使用的示例pdf位于： http ： //www.bergophil.ch/a.pdf import java.awt.image.BufferedImage; import java.io.FileOutputStream; import java.io.IOException; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.pdmodel.PDPage; import cafe.image.ImageColorType; import cafe.image.ImageParam; import cafe.image.options.TIFFOptions; import cafe.image.tiff.TIFFTweaker; import cafe.image.tiff.TiffFieldEnum.Compression; import cafe.io.FileCacheRandomAccessOutputStream; import cafe.io.RandomAccessOutputStream; public class Pdf2TiffConverter { public static void main(String[] args) { String pdf = “a.pdf”; PDDocument pddoc = null; […]

如何使用文本或图像为PDF水印？: 我在一个文件夹中有一堆PDF文档，我想用水印来增加它们。 Java服务器上下文有哪些选择？优选地，水印将支持透明度。矢量和光栅都是可取的。

PDFBox：将pdf页面转换为图像的问题: 我的任务非常简单：将pdf文件的每一页转换为图像。我尝试使用icepdf开源版本来生成图像，但它们不会生成具有正确字体的图像。所以我开始使用PDFBox。代码如下： PDDocument document = PDDocument.load(new File(“testing.pdf”)); List pages = document.getDocumentCatalog().getAllPages(); for (int i = 0; i < pages.size(); i++) { PDPage singlePage = pages.get(i); BufferedImage buffImage = convertToImage(singlePage, 8, 12); ImageIO.write(buffImage, "png", new File(PdfUtil.DATA_OUTPUT_DIR+(count++)+".png")); } 字体看起来不错，但pdf文件中的图片看起来很晕眩（参见附件）。我查看源代码，但我仍然不知道如何解决它。你们有什么想法发生了什么事吗？请帮忙。谢谢！！

可以使用iText连接/合并pdf的函数 – 导致一些问题: 我正在使用以下代码使用iText将PDF合并在一起： public static void concatenatePdfs(List listOfPdfFiles, File outputFile) throws DocumentException, IOException { Document document = new Document(); FileOutputStream outputStream = new FileOutputStream(outputFile); PdfWriter writer = PdfWriter.getInstance(document, outputStream); document.open(); PdfContentByte cb = writer.getDirectContent(); for (File inFile : listOfPdfFiles) { PdfReader reader = new PdfReader(inFile.getAbsolutePath()); for (int i = 1; i <= reader.getNumberOfPages(); i++) { document.newPage(); PdfImportedPage […]

IText阅读PDF格式如pdftotext -layout？: 我正在寻找最简单的方法来实现一个类似于输出的安静的java解决方案 pdftotext -layout FILE 在Linux机器上。（当然它也应该便宜）我刚刚尝试了一些IText，PDFBox和PDFTextStream的代码片段。到目前为止，最准确的解决方案是PDFTextStream，它使用VisualOutputTarget来获得我文件的绝佳表示。所以我的列布局被认可是正确的，我可以使用它。但IText也应该有解决方案，或者？我发现的每个简单片段都会产生简单有序的字符串，这些字符串很混乱（混乱行/列/行）。是否有任何解决方案可能更容易，可能不涉及自己的战略？或者是否有可以使用的开源策略？ //我按照mkl的说明编写了自己的策略对象，如下所示： package com.test.pdfextractiontest.itext; import … public class MyLocationTextExtractionStrategy implements TextExtractionStrategy { /** set to true for debugging */ static boolean DUMP_STATE = false; /** a summary of all found text */ private final List locationalResult = new ArrayList(); public MyLocationTextExtractionStrategy() { } […]