Tag: pdf

iText 5.5.3 PDFPCell:长文本不适合单元格(不正确地包装文本)

我正在尝试创建一个包含表格的波斯语PDF,我想写入它。 当我的字符串很长时,它不能正确地适合单元格。 感觉像字符串填充单元格颠倒!…我的意思是例如当我想写“你好我的朋友。什么事情?” 在单元格中输出如下: | 这是怎么回事? | | 我的朋友| | 你好| 但当然是波斯语(用英语写的) 在这里,我顺便附上了代码 private LanguageProcessor al = new ArabicLigaturizer(); cell = new PdfPCell(new Phrase(al.process(persian_text), fontNormal)); cell.setHorizontalAlignment(Element.ALIGN_RIGHT); cell.setVerticalAlignment(Element.ALIGN_TOP); cell.setBorderWidth(0); table.addCell(cell); 我会感激你的帮助

是否有用于生成MOBI电子书文档的Java或Ruby库?

在Caliber项目中有一个Python库,但我想找到一个可以在Clojure或Ruby中使用的库。 有任何想法吗?

Java Spring MVC在浏览器中显示PDF

如何强制浏览器显示pdf而不是下载? 这是控制器 @RequestMapping(value = “/preview.pdf”, method = RequestMethod.GET) protected String preivewSection( HttpServletRequest request, HttpSession httpSession, HttpServletResponse response) { try { byte[] documentInBytes = getDocument(); response.setHeader(“Content-Disposition”, “inline; filename=\”report.pdf\””); response.setDateHeader(“Expires”, -1); response.setContentType(“application/pdf”); response.setContentLength(documentInBytes.length); response.getOutputStream().write(documentInBytes); } catch (Exception ioe) { } finally { } return null; }

从扫描的PDF中读取QR码

我正在尝试从PDF文件中插入和读取qrcode。 要从图像中创建/读取qr代码我正在使用zxing项目并操纵pdf我正在使用Big Faceless PDF 。 如果我创建QR码,插入我的pdf,然后从pdf读取图像并将正确的一个转换为QR码,一切都很好。 但是 ,如果我试图从扫描的文档中读取图像(附有qr代码贴纸),我无法从pdf获取qr代码图像(我可以获得的唯一图像,使用Big Faceless PDF,是文档它自己)。 有谁知道一个Java库在pdf文件中搜索qr代码? 谢谢你的帮助

使用OCR的PDF文本提取方法

有人试图使用OCR库和Java从PDF中提取文本吗? 你发现什么是最可靠的文本提取库。 我见过的大多数方法(tesseract,GOCR)都是需要编写一些JNI代码的C库。 我熟悉pdfbox,它现在是0.8.x版本的Apache孵化器项目,但它的文本提取并不总是准确的。 我正在寻找一种更可靠的替代方法。 我还没有尝试过Asprise JavaPDF,在尝试这个过程中,但想了解更多有关OCR方法的信息(如果可能的话)。 任何帮助,将不胜感激。

在iText上填写复选框

我正在尝试使用iText修改现有PDF。 我的代码目前很好地编辑了文本字段,但我无法勾选或取消选中复选框。 PdfReader reader = new PdfReader(INPUTFILE); int n = reader.getNumberOfPages(); PdfStamper filledOutForm = new PdfStamper(reader, new FileOutputStream(“WrittenForm.pdf”)); AcroFields fields = filledOutForm.getAcroFields(); //not working fields.setField(“checkbox”, “On”); //working fields.setField(“textfield1”, “infinite road”); fields.setField(“textfield2”, “jayboy”); filledOutForm.close(); 有任何想法吗? 解决了: String states[] = fields.getAppearanceStates(“checkbox”); //prints array values – returns ‘yes, no’ System.out.println(Arrays.toString(states));

从PDF复制粘贴在原始文件上是乱码,但在使用CutePDF打印pdf时已修复

我有这个PDF文件 ,是希腊语。 尝试从中复制和粘贴文本时会出现一个已知问题 ,导致轻微的乱码。 我说轻微而不是全部的原因是,虽然粘贴的输出在希腊语中没有意义,但它由有效的希腊字符组成。 此外,该问题的一个有趣方面是并非所有字符都映射错误。 例如,如果您比较此原始文本条带 ΕΞ. ΕΠΕΙΓΟΝ – ΑΜΕΣΗ ΕΦΑΡΜΟΓΗ ΝΑ ΣΤΑΛΕΙ ΚΑΙ ΜΕ Ε-ΜΑIL 使用PDF中粘贴的内容: ΔΞ. ΔΠΔΙΓΟΝ – ΑΜΔ΢Η ΔΦΑΡΜΟΓΗ ΝΑ ΢ΣΑΛΔΙ ΚΑΙ ΜΔ Δ-ΜΑIL 您会注意到某些字符被正确粘贴,而其他字符则没有。 值得一提的是,错误的字符reflection映射错误,例如Ε变为Δ ,反之亦然。 当我使用Adobe打开PDF,并使用PDF编写器打印它,在这种情况下,CutePDF,复制和粘贴时的输出是正确的! 鉴于上述情况,我的问题如下: 这种行为的根本原因是什么? 如何将解决方案集成到基于java的工作流程中,以便随机导入PDF文件? 编辑:一些错别字

Java关闭PDF错误

我有这个java代码: try { PDFTextStripper pdfs = new PDFTextStripper(); String textOfPDF = pdfs.getText(PDDocument.load(“doc”)); doc.add(new Field(campo.getDestino(), textOfPDF, Field.Store.NO, Field.Index.ANALYZED)); } catch (Exception exep) { System.out.println(exep); System.out.println(“PDF fail”); } 抛出这个: 11:45:07,017 WARN [COSDocument] Warning: You did not close a PDF Document 而且我不知道为什么要扔掉这个1,2,3或更多。 我发现COSDocument是一个类并且有close()方法,但是我没有使用这个类。 我有这个import: import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.util.PDFTextStripper; 谢谢 :)

将jsp表导出为ex​​cel,word,pdf

任何人都可以建议我任何库/ jar文件,我可以用来将我的表导出到excel / pdf / word。 请告诉我是否有可以在jsp中创建报告的库。

ITextRenderer:将页面高度调整为内容

我正在使用ITextRenderer从HTML生成PDF,我需要做的是收银机收据。 此收据具有动态宽度,当然还有动态内容。 这就是说,内容的高度总是不同的,现在我正在努力寻找一种方法来调整PDF页面的高度到内容。 如果它太大,收据最后会有一个长的白色部分,如果要缩短PDF的分页,我需要它只在一个页面中。 我正在使用@page {size: Wpx Hpx;}来设置页面大小,但根据宽度和数据计算内容高度几乎是不可能的(会非常痛苦)。 这是生成PDF的代码: ITextRenderer renderer = new ITextRenderer(); byte[] bytes = htmlDocumentString.toString().getBytes(“UTF-8”); ByteArrayInputStream bais = new ByteArrayInputStream(bytes); DocumentBuilder builder = DocumentBuilderFactory.newInstance().newDocumentBuilder(); InputSource is = new InputSource(bais); Document doc = builder.parse(is); renderer.setDocument(doc, null); renderer.layout(); renderer.createPDF(outputStream); outputStream.flush(); outputStream.close(); 我也试过renderer.getSharedContext().setPrint(false); 但是这引发了NPE。 还@page {-fs-page-sequence: “none”;}没有任何运气。 ————–“解决方案”—————- 我找到的解决方案甚至不是很接近完美,但有效! @page { size: Wpx 1px; } […]