Tag: pdf

Java:Apache PDFbox提取突出显示的文本

我正在使用Apache PDFbox库从PDF文件中提取突出显示的文本(即黄色背景)。 我对这个库完全是新手,并且不知道它用于此目的的哪个类。 到目前为止,我已使用下面的代码从注释中提取文本。 PDDocument pddDocument = PDDocument.load(new File(“test.pdf”)); List allPages = pddDocument.getDocumentCatalog().getAllPages(); for (int i = 0; i < allPages.size(); i++) { int pageNum = i + 1; PDPage page = (PDPage) allPages.get(i); List la = page.getAnnotations(); if (la.size() < 1) { continue; } System.out.println("Total annotations = " + la.size()); System.out.println("\nProcess Page " + […]

iText图像resize

我有一个水印,我想把它放入我的PDF格式。 水印是.bmp图像,并且是2290 x 3026.我在尝试调整此图片以适应页面时遇到了很多麻烦,有没有人有任何建议? Document document = new Document(); PdfWriter.getInstance(document, new FileOutputStream(“result.pdf”)); document.open(); document.add(new Paragraph(“hello”)); document.close(); PdfReader reader = new PdfReader(“result.pdf”); int number_of_pages = reader.getNumberOfPages(); PdfStamper pdfStamper = new PdfStamper(reader, new FileOutputStream(“result_watermark.pdf”)); // Get the PdfContentByte type by pdfStamper. Image watermark_image = Image.getInstance(“abstract(0307).bmp”); int i = 0; watermark_image.setAbsolutePosition(0, 0); watermark_image.scaleToFit(826, 1100); System.out.println(watermark_image.getScaledWidth()); System.out.println(watermark_image.getScaledHeight()); PdfContentByte add_watermark; […]

适用于GAE的Java PDF库?

由于GAE有严格的限制,例如“Java应用程序不能使用任何用于写入文件系统的类”…… 是否有一个好的Java PDF库可以将PDF写入内存以便流式传输到云端?

Itext将字体嵌入PDF中

我有一个使用Foxit表单设计器创建的pdf。 在我的设计系统上,我安装了条形码字体。 条形码字体用于其中一个AcroFields。 似乎foxit没有在文档中嵌入字体。 我也有客户没有在他们的计算机上安装条形码字体,因此我想将字体嵌入到PDF中。 有没有办法让我使用iText将AcroFields中使用的字体嵌入到PDF中? 编辑:字体似乎包含在文本中,但不包括字段,因此字体(条形码)将不会打印。

将PDF文件转换为图像

我想将PDF文档转换为图像。 我在使用Ghost4j。 问题: Ghost4J在运行时需要gsdll32.dll文件,我不想使用dll文件。 问题1:有没有办法,在ghost4j中转换图像而不用dll? 问题2:我在PDFBox API中找到了解决方案。 org.apache.pdfbox.pdmodel.PDPagep have method convertToImage()`,它将PDF页面转换为图像格式。 PDDocument doc = PDDocument.load(new File(“/document.pdf”)); Listpages = doc.getDocumentCatalog().getAllPages(); PDPage page = pages.get(0); BufferedImage image =page.convertToImage(); File outputfile = new File(“/image.png”); ImageIO.write(image, “png”, outputfile); doc.close(); 我在PDF文档上只有文字。 我运行此代码时遇到exception: Aug 12, 2013 6:00:24 PM org.apache.pdfbox.util.PDFStreamEngine processOperator INFO: unsupported/disabled operation: BDC Exception in thread “main” java.lang.ExceptionInInitializerError at org.apache.pdfbox.pdmodel.font.PDTrueTypeFont.getawtFont(PDTrueTypeFont.java:481) […]

用于将现有PDF转换为PDF / A的免费Java库

我想将PDF转换为PDF / A. 目前我可以使用OpenOffice pdf viewer插件和Jodconverter 2一起完成此操作。 但这样做非常麻烦。 有没有人知道我可以用来做这个的任何开源/免费Java库? 到目前为止,我已经找到了这些开源库,但是没有一个支持将PDF转换为PDF / A. iText的 gnujpdf PDF框 FOP JFreeReport的 PJX JPedal PDFjet JPOD PDF渲染器 UPDATE 似乎Apache FOP能够将文档(不是PDF文档)转换为PDF / A.

是否有任何Java PDF创建替代iText?

我试图通过FOP渲染大约100,000 – 80列记录,并且每次都可以使用它(OutOfMemoryException)。 我知道iText可以处理这种负载,但由于LGPL许可证,我无法使用它。 iText是否有可以处理大量数据到PDF的替代Java库?

如何围绕多行文本绘制矩形

我想在iText中围绕多行文字绘制一个矩形。 用户将能够输入一些文本行。 文本的字体大小可能不同,可以格式化(粗体,带下划线的…)。 我用这段代码来绘制文字: ColumnText ct = new ColumnText(cb); Phrase phrase = new Phrase(“Some String\nOther string etc…\n test”); ct.setSimpleColumn(myText……); ct.addElement(phrase); ct.go(); 我知道如何绘制一个矩形,但是我无法绘制一个勾勒出这个文本的矩形。

替换PDF中的签名内容

如何在iText中完成? 我有一张带有客户签名的PDF。 我需要为无符号属性添加ocsp响应。 我知道如何使用改变签名本身 org.bouncycastle.cms.CMSSignedData.replaceSigners(…).getEncoded() 但我不知道如何使用new PdfString(newSignature).setHexWriting(true)替换PDF中的new PdfString(newSignature).setHexWriting(true) 。 如果我使用此代码: PdfDictionary other = new PdfDictionary(); other.put(PdfName.CONTENTS, new PdfString(newSignature).setHexWriting(true)); dicSignature.merge(other); 其中dicSignature是包含签名的字典,然后签名(在Adobe Reader中打开文档时)被破坏。

PDFBox Pdf到图像丢失QR码“ColorSpace Pattern不提供非抚摸颜色”

类似于这个SO PDFBox – PDF到图像丢失条形码 有问题的PDF: https : //drive.google.com/file/d/0B13zTPQR9uxscXRMWjhsZ0doa00/view?usp=sharing 有最小的文本和中等大小的QR码。 我尝试了许多不同的解决方案,使用PDFBox / ImageIO将此PDF页面转换为图像,但到目前为止,结果中始终缺少QR码。 当我使用PDFBox的PDFImageWriter时,我得到这个日志: ColorSpace Pattern doesn’t provide a non-stroking color, using white instead! 我认为这与二维码有关。 这是预期的行为吗? 其他人可以确认PDFBox无法从此PDF中复制QR码吗? 有没有办法使用Java或PDFBox将其转换为图像?