Tag: pdf

使用base64图像的HTML到PDF会抛出FileNotFoundException

我正在使用itextpdf-5.0.6.jar(Java 8),当我尝试使用base64图像标记导出html代码时,我得到文件未找到exception。 如果我删除图像标记一切都很好! 我发现很少有关于覆盖图像标签处理器的解决方案,但是大多数都是旧的并且与5.0.6版本不兼容。 这是我发送的HTML: “\n\n\n \n Test PDF\n\n\n\n \n\n \n\n\n\n\n\n\nHellow world\n” 我的代码的一部分: fileOutputStream = new FileOutputStream(file); Document document = new Document(); PdfWriter.getInstance(document, fileOutputStream); document.open(); HTMLWorker htmlWorker = new HTMLWorker(document); StringReader stringReader = new StringReader(htmlCode); htmlWorker.parse(stringReader); document.close(); fileOutputStream.close(); 任何帮助都会被感谢

IText在PDF上编辑或删除图层

H全部, 我正在使用IText在PDF上添加文本图层。 现在我想编辑PDF上的现有图层,图层也仅由IText创建。 似乎IText没有这样的方法来支持。 我想到的另一种方法是删除现有的Layer并在其位置放置新图层。 IText也不支持似乎删除。 有什么办法吗? 谢谢你。

使用java将多个图像添加到使用iText的单个pdf文件中

我有以下代码,但此代码仅将最后一个图像添加到pdf中。 try { filePath = (filePath != null && filePath.endsWith(“.pdf”)) ? filePath : filePath + “.pdf”; Document document = new Document(); PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(filePath)); document.open(); // document.add(new Paragraph(“Image Example”)); for (String imageIpath : imagePathsList) { // Add Image Image image1 = Image.getInstance(imageIpath); // Fixed Positioning image1.setAbsolutePosition(10f, 10f); // Scale to new height […]

获取PDF中的确切Stringposition

我试图读取一个流,并希望得到每个String的确切位置(坐标) int size = reader.getXrefSize(); for (int i = 0; i < size; ++i) { PdfObject pdfObject = reader.getPdfObject(i); if ((pdfObject == null) || !pdfObject.isStream()) continue; PdfStream stream = (PdfStream) pdfObject; PdfObject obj = stream.get(PdfName.FILTER); if ((obj != null) && obj.toString().equals(PdfName.FLATEDECODE.toString())) { byte[] codedText = PdfReader.getStreamBytesRaw((PRStream) stream); byte[] text = PdfReader.FlateDecode(codedText); FileOutputStream o = new […]

将PDF转换为多页tiff(第4组)

我正在尝试将org.apache.pdfbox.pdmodel.PDDocument类和icafe库( https://github.com/dragon66/icafe/ )所代表的PDF转换为具有第4组压缩和300 dpi的多页tiff 。 示例代码适用于我288 dpi,但奇怪的是不是300 dpi,导出的tiff仍然只是白色。 有谁知道这里的问题是什么? 我在示例中使用的示例pdf位于: http : //www.bergophil.ch/a.pdf import java.awt.image.BufferedImage; import java.io.FileOutputStream; import java.io.IOException; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.pdmodel.PDPage; import cafe.image.ImageColorType; import cafe.image.ImageParam; import cafe.image.options.TIFFOptions; import cafe.image.tiff.TIFFTweaker; import cafe.image.tiff.TiffFieldEnum.Compression; import cafe.io.FileCacheRandomAccessOutputStream; import cafe.io.RandomAccessOutputStream; public class Pdf2TiffConverter { public static void main(String[] args) { String pdf = “a.pdf”; PDDocument pddoc = null; […]

在Java中将PDF转换为缩略图

任何人都可以建议我一个免费的Java库,它可以转换PDF并从第一页创建缩略​​图(PNG)。 谢谢。

如何使用文本或图像为PDF水印?

我在一个文件夹中有一堆PDF文档,我想用水印来增加它们。 Java服务器上下文有哪些选择? 优选地,水印将支持透明度。 矢量和光栅都是可取的。

PDFBox:将pdf页面转换为图像的问题

我的任务非常简单:将pdf文件的每一页转换为图像。 我尝试使用icepdf开源版本来生成图像,但它们不会生成具有正确字体的图像。 所以我开始使用PDFBox。 代码如下: PDDocument document = PDDocument.load(new File(“testing.pdf”)); List pages = document.getDocumentCatalog().getAllPages(); for (int i = 0; i < pages.size(); i++) { PDPage singlePage = pages.get(i); BufferedImage buffImage = convertToImage(singlePage, 8, 12); ImageIO.write(buffImage, "png", new File(PdfUtil.DATA_OUTPUT_DIR+(count++)+".png")); } 字体看起来不错,但pdf文件中的图片看起来很晕眩(参见附件)。 我查看源代码,但我仍然不知道如何解决它。 你们有什么想法发生了什么事吗? 请帮忙。 谢谢!!

可以使用iText连接/合并pdf的函数 – 导致一些问题

我正在使用以下代码使用iText将PDF合并在一起: public static void concatenatePdfs(List listOfPdfFiles, File outputFile) throws DocumentException, IOException { Document document = new Document(); FileOutputStream outputStream = new FileOutputStream(outputFile); PdfWriter writer = PdfWriter.getInstance(document, outputStream); document.open(); PdfContentByte cb = writer.getDirectContent(); for (File inFile : listOfPdfFiles) { PdfReader reader = new PdfReader(inFile.getAbsolutePath()); for (int i = 1; i <= reader.getNumberOfPages(); i++) { document.newPage(); PdfImportedPage […]

IText阅读PDF格式如pdftotext -layout?

我正在寻找最简单的方法来实现一个类似于输出的安静的java解决方案 pdftotext -layout FILE 在Linux机器上。 (当然它也应该便宜) 我刚刚尝试了一些IText,PDFBox和PDFTextStream的代码片段。 到目前为止,最准确的解决方案是PDFTextStream,它使用VisualOutputTarget来获得我文件的绝佳表示。 所以我的列布局被认可是正确的,我可以使用它。 但IText也应该有解决方案,或者? 我发现的每个简单片段都会产生简单有序的字符串,这些字符串很混乱(混乱行/列/行)。 是否有任何解决方案可能更容易,可能不涉及自己的战略? 或者是否有可以使用的开源策略? //我按照mkl的说明编写了自己的策略对象,如下所示: package com.test.pdfextractiontest.itext; import … public class MyLocationTextExtractionStrategy implements TextExtractionStrategy { /** set to true for debugging */ static boolean DUMP_STATE = false; /** a summary of all found text */ private final List locationalResult = new ArrayList(); public MyLocationTextExtractionStrategy() { } […]