Tag: pdf

如何阅读使用未知的随机所有者密码创建的PDF?

要求是一次处理一批PDF,并且成功使用用户密码对每个PDF进行加密。 但是,这些PDF以前是使用随机生成的动态所有者密码(不知道任何一个)加密的,以防止任何编辑。 我使用iText进行加密,如下所示: byte[] userPass = “user”.getBytes(); byte[] ownerPass = “owner”.getBytes(); PdfReader reader = new PdfReader(“Misc.pdf”); PdfStamper stamper = new PdfStamper(reader, new FileOutputStream(“Processed_Encrypted.pdf”)); stamper.setEncryption(userPass, ownerPass, PdfWriter.ALLOW_PRINTING, PdfWriter.ENCRYPTION_AES_128 | PdfWriter.DO_NOT_ENCRYPT_METADATA); stamper.close(); reader.close(); 但是这段代码抛出了一个com.itextpdf.text.exceptions.BadPasswordException: PdfReader not opened with owner password 有人可以指导如何解决此错误/绕过所有者密码? 在这里,我想明确表示我们合法拥有这些PDF,因此不会犯下任何犯罪/黑客行为。 PS :解决方案不仅限于iText,也可以使用任何其他Java库( 免费或许可 )。

通过java压缩带有大图像的pdf

寻找一种压缩PDF格式的图像并输出pdf进行存档的方法。 我无法在创建之前压缩图像,因为它会影响打印质量。 每个pdf的大小约为8MB,其中大部分由2个图像组成。 图像采用png格式,并在生成期间生成pdf(使用第三方生成器) 有没有办法在不使用第三方工具的情况下在java中压缩这些。 我试过pdfbox,itext和第三方exe(neevia),第三方工具是迄今为止给我任何结果的唯一一个(下降到大约半MB)但我不想放弃对exe的控制。 示例代码如下。 import java.io.BufferedReader; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.util.Arrays; import org.apache.pdfbox.exceptions.COSVisitorException; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.pdmodel.common.PDStream; import com.itextpdf.text.DocumentException; import com.itextpdf.text.pdf.PdfReader; import com.itextpdf.text.pdf.PdfStamper; import com.itextpdf.text.pdf.PdfWriter; public class compressPDF { public static void main (String[] args) throws IOException, DocumentException, COSVisitorException { /* * Using PDF Box */ PDDocument […]

如何使用PDFBox drawString插入换行符

我必须用表制作PDF。 到目前为止它工作正常,但现在我想添加一个包装function。 所以我需要插入换行符。 contentStream.beginText(); contentStream.moveTextPositionByAmount(x, y); contentStream.drawString(“Some text to insert into a table.”); contentStream.endText(); 我想在“插入”之前添加“ \n ”。 我尝试了“ \u000A ”这是换行的hex值,但是Eclipse向我显示错误。 是否可以使用drawString添加换行符?

将一个PDF页面拆分为两个

我想将一个宽PDF页面分成两个PDF页面。 我的原始页面宽两个A4页面大小但高度正常(对于A4)。 我试图使用IText但没有效果。 谢谢你的关注。

如何在android中将位图转换为PDF格式

**我在“thepic”变量中有位图类型的位图。 imageUri = (Uri) intent.getParcelableExtra(Intent.EXTRA_STREAM); String realpath=getRealPathFromURI(imageUri); thepic = BitmapFactory.decodeFile(realpath);**

Apache Tika提取扫描PDF文件

我在使用Apache TIKA(版本1.10)时遇到了一些麻烦。 我得到了一些PDF文件,这些文件只是扫描过的纸片。 这意味着每个页面只是一个图像。 我的目标是提取PDF文件的文本。 我的tesseract设置正确,提取JPG和PNG文件就像一个魅力。 我正在使用的代码看起来像那样(不介意缺少的除外处理): public String extractText(InputStream stream) { AutoDetectParser parser = new AutoDetectParser(); BodyContentHandler handler = new BodyContentHandler(Integer.MAX_VALUE); Metadata metadata = new Metadata(); ParseContext context = new ParseContext(); parser.parse(stream, handler, metadata, context); String text = handler.toString(); return text; } 我搜索了很多,但我找不到任何适合我的解决方案。 我已经尝试过PDFParserConfig类的setExtractInlineImages方法,但这没有改变。 使用自定义ParsingEmbeddedDocumentExtractor提取嵌入的文档确实提取了doc文件的嵌入资源,但没有提取我的PDF文件。 如果你们中的任何人都能提供一些帮助,那真是棒极了:)

使用PDFBox从PDF文档中读取特定页面

如何使用PDFBox从PDF文档中读取特定页面(给定页码)?

如何使用pdfbox从pdf中提取粗体文本?

我正在使用Apache pdfbox来提取文本。 我可以从pdf中提取文本,但我不知道如何知道这个词是否是粗体??? (代码建议会很好!!!)这是从pdf中提取纯文本的代码,该代码工作正常。 PDDocument document = PDDocument .load(“/home/lipu/workspace/MRCPTester/test.pdf”); document.getClass(); if (document.isEncrypted()) { try { document.decrypt(“”); } catch (InvalidPasswordException e) { System.err.println(“Error: Document is encrypted with a password.”); System.exit(1); } } // PDFTextStripperByArea stripper = new PDFTextStripperByArea(); // stripper.setSortByPosition(true); PDFTextStripper stripper = new PDFTextStripper(); stripper.setStartPage(1); stripper.setEndPage(2); stripper.setSortByPosition(true); String st = stripper.getText(document);

一个很好的库,用于将PDF转换为TIFF?

我需要一个Java库来将PDF转换为TIFF图像。 PDF是传真,我将转换为TIFF,以便我可以在图像上进行条形码识别。 任何人都可以推荐一个好的免费开源库,用于从PDF转换为TIFF吗?

使用javax.print库以属性(托盘控制,双工等)打印

我一直在努力确定一种方法来使用标准Java打印库来打印文件 – 特别是PDF文档 – 具有某些属性 – 特别是某些托盘或使用双面打印。 关于如何做到这一点存在大量的文档,事实上,我已经研究并尝试了这些方法。 典型的方式是这样的: public static void main (String [] args) { try { PrintService[] pservices = PrintServiceLookup.lookupPrintServices(null, null); //Acquire Printer PrintService printer = null; for (PrintService serv: pservices) { System.out.println(serv.toString()); if (serv.getName().equals(“PRINTER_NAME_BLAH”)) { printer = serv; } } if (printer != null) { System.out.println(“Found!”); //Open File FileInputStream fis = […]