Tag: pdf

检查PDF文件是否为扫描文件

以编程方式检查PDF文件是否完全扫描的最佳方法是什么? 我有iText和PDFBox供我使用。 我可以检查pdf文件是否包含文本,并根据结果来确定此文件是否为OCR,但此解决方案不是100%准确。 我想知道是否有另一种方法可以解决这个问题。 如您所知,解决方案必须基于Java。

如何在android上创建pdf文件

找不到任何库在Android上创建pdf文件。 谁能帮我?

合并pdf并在java中添加iText书签

如何使用iText将书签添加到现有PDF? 我将多个PDF合并为一个PDF,我需要为最终的PDF构建书签。 例如,我有三个PDF:doc1.pdf,doc2.pdf和doc3.pdf,doc1和doc2属于Group1,doc3属于Group2。 我需要合并它们,并且必须为生成的PDF构建嵌套书签,如下所示: Group1 doc1 doc2 Group2 doc3 等等

如何使用Java iText检查所有使用的字体是否嵌入到PDF中?

如何检查PDF文件中使用的所有字体是否都嵌入到带有Java和iText的文件中? 我有一些现有的PDF文档,我想validation他们只使用嵌入字体。 这需要检查是否使用了PDF标准字体,并且文件中嵌入了其他使用过的字体。

使用Java PDFBox库编写俄语PDF

我正在使用一个名为PDFBox的Java库来尝试将文本写入PDF。 它适用于英文文本,但当我试图在PDF中写入俄文文本时,这些字母显得很奇怪。 似乎问题在于使用的字体,但我对此不太确定,所以我希望有人能指导我完成这个。 以下是重要的代码行: PDTrueTypeFont font = PDTrueTypeFont.loadTTF( pdfFile, new File( “fonts/VREMACCI.TTF” ) ); // Windows Russian font imported to write the Russian text. font.setEncoding( new WinAnsiEncoding() ); // Define the Encoding used in writing. // Some code here to open the PDF & define a new page. contentStream.drawString( “отделом компьютерной” ); // Write the […]

乌克兰(西里尔文)字符未显示在Jasper报告PDF中

我试图在jasper报告中显示ukranian字符作为pdf文件。 但它不是以pdf格式显示的。 当我将报告导出到所有其他格式如html时,显示csv..ukranian char。

使用iText库在pdf中插入隐藏的摘要

我使用iText库(Java)搜索一个方法,用于将摘要(字节数组或字符串)插入PDF文件。 我使用此方法从String创建摘要: private String crypt(double x, ByteArrayOutputStream baos) throws UnsupportedEncodingException, NoSuchAlgorithmException{ MessageDigest md = MessageDigest.getInstance(“SHA-256”); md.update(String.valueOf(x).getBytes(“UTF-8”)); md.update(String.valueOf(baos).getBytes(“UTF-8”)); byte[] digest = md.digest(); StringBuffer sb = new StringBuffer(); for(byte d:digest){ sb.append(Integer.toHexString(0xFF & d)); } return sb.toString(); } 摘要不应在PDF中看到,但必须将其摘录以进行比较。

在iText中将图像添加到acrofield?

我正在尝试使用acrofields填充PDF,我能够完美地添加字符串数据,但在向acrofields添加图像时遇到了问题。 这是我添加字符串数据的代码。 File f = new File(“F:/Test/Agreement.pdf”); InputStream sourceTemplatePDFUrlStream = new BufferedInputStream(new FileInputStream(f)); File destinationFile = new File(“F:/Test/ag1.pdf”); PdfReader reader = new PdfReader(sourceTemplatePDFUrlStream); PdfStamper stamper = new PdfStamper(reader, new FileOutputStream( destinationFile)); AcroFields form = stamper.getAcroFields(); Image img = Image.getInstance(“E:/signature/signature.png”); Set fields = form.getFields().keySet(); Hashtable val = new Hashtable(); val.put(“name”, “xxx” ); val.put(“city_street_zip”, “xxx”+” “+”xxx”+” “+”xxx”); […]

使用Apache POI将doc转换为pdf

我正在尝试使用Apache POI将doc转换为pdf,但生成的pdf文档只包含文本,它没有像图像,表格对齐等任何格式。 如何将doc转换为pdf,并具有表格,图像,对齐等所有格式? 这是我的代码: import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.OutputStream; import com.lowagie.text.Document; import com.lowagie.text.DocumentException; import com.lowagie.text.Paragraph; import com.lowagie.text.pdf.PdfWriter; import org.apache.poi.hwpf.HWPFDocument; import org.apache.poi.hwpf.extractor.WordExtractor; import org.apache.poi.hwpf.usermodel.Range; import org.apache.poi.poifs.filesystem.POIFSFileSystem; public class demo { public static void main(String[] args) { POIFSFileSystem fs = null; Document document = new Document(); try { System.out.println(“Starting the test”); fs = new […]

如何使用iText以正确的顺序从PDF中提取图像?

我试图从PDF文件中提取图像。 我在网上找到了一个很好的例子: PdfReader reader; File file = new File(“example.pdf”); reader = new PdfReader(file.getAbsolutePath()); for (int i = 0; i < reader.getXrefSize(); i++) { PdfObject pdfobj = reader.getPdfObject(i); if (pdfobj == null || !pdfobj.isStream()) { continue; } PdfStream stream = (PdfStream) pdfobj; PdfObject pdfsubtype = stream.get(PdfName.SUBTYPE); if (pdfsubtype != null && pdfsubtype.toString().equals(PdfName.IMAGE.toString())) { byte[] img = […]