Tag: pdf

检查PDF文件是否为扫描文件: 以编程方式检查PDF文件是否完全扫描的最佳方法是什么？我有iText和PDFBox供我使用。我可以检查pdf文件是否包含文本，并根据结果来确定此文件是否为OCR，但此解决方案不是100％准确。我想知道是否有另一种方法可以解决这个问题。如您所知，解决方案必须基于Java。

合并pdf并在java中添加iText书签: 如何使用iText将书签添加到现有PDF？我将多个PDF合并为一个PDF，我需要为最终的PDF构建书签。例如，我有三个PDF：doc1.pdf，doc2.pdf和doc3.pdf，doc1和doc2属于Group1，doc3属于Group2。我需要合并它们，并且必须为生成的PDF构建嵌套书签，如下所示： Group1 doc1 doc2 Group2 doc3 等等

如何使用Java iText检查所有使用的字体是否嵌入到PDF中？: 如何检查PDF文件中使用的所有字体是否都嵌入到带有Java和iText的文件中？我有一些现有的PDF文档，我想validation他们只使用嵌入字体。这需要检查是否使用了PDF标准字体，并且文件中嵌入了其他使用过的字体。

使用Java PDFBox库编写俄语PDF: 我正在使用一个名为PDFBox的Java库来尝试将文本写入PDF。它适用于英文文本，但当我试图在PDF中写入俄文文本时，这些字母显得很奇怪。似乎问题在于使用的字体，但我对此不太确定，所以我希望有人能指导我完成这个。以下是重要的代码行： PDTrueTypeFont font = PDTrueTypeFont.loadTTF( pdfFile, new File( “fonts/VREMACCI.TTF” ) ); // Windows Russian font imported to write the Russian text. font.setEncoding( new WinAnsiEncoding() ); // Define the Encoding used in writing. // Some code here to open the PDF & define a new page. contentStream.drawString( “отделом компьютерной” ); // Write the […]

乌克兰（西里尔文）字符未显示在Jasper报告PDF中: 我试图在jasper报告中显示ukranian字符作为pdf文件。但它不是以pdf格式显示的。当我将报告导出到所有其他格式如html时，显示csv..ukranian char。

使用iText库在pdf中插入隐藏的摘要: 我使用iText库（Java）搜索一个方法，用于将摘要（字节数组或字符串）插入PDF文件。我使用此方法从String创建摘要： private String crypt(double x, ByteArrayOutputStream baos) throws UnsupportedEncodingException, NoSuchAlgorithmException{ MessageDigest md = MessageDigest.getInstance(“SHA-256”); md.update(String.valueOf(x).getBytes(“UTF-8”)); md.update(String.valueOf(baos).getBytes(“UTF-8”)); byte[] digest = md.digest(); StringBuffer sb = new StringBuffer(); for(byte d:digest){ sb.append(Integer.toHexString(0xFF & d)); } return sb.toString(); } 摘要不应在PDF中看到，但必须将其摘录以进行比较。

在iText中将图像添加到acrofield？: 我正在尝试使用acrofields填充PDF，我能够完美地添加字符串数据，但在向acrofields添加图像时遇到了问题。这是我添加字符串数据的代码。 File f = new File(“F:/Test/Agreement.pdf”); InputStream sourceTemplatePDFUrlStream = new BufferedInputStream(new FileInputStream(f)); File destinationFile = new File(“F:/Test/ag1.pdf”); PdfReader reader = new PdfReader(sourceTemplatePDFUrlStream); PdfStamper stamper = new PdfStamper(reader, new FileOutputStream( destinationFile)); AcroFields form = stamper.getAcroFields(); Image img = Image.getInstance(“E:/signature/signature.png”); Set fields = form.getFields().keySet(); Hashtable val = new Hashtable(); val.put(“name”, “xxx” ); val.put(“city_street_zip”, “xxx”+” “+”xxx”+” “+”xxx”); […]

使用Apache POI将doc转换为pdf: 我正在尝试使用Apache POI将doc转换为pdf，但生成的pdf文档只包含文本，它没有像图像，表格对齐等任何格式。如何将doc转换为pdf，并具有表格，图像，对齐等所有格式？这是我的代码： import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.OutputStream; import com.lowagie.text.Document; import com.lowagie.text.DocumentException; import com.lowagie.text.Paragraph; import com.lowagie.text.pdf.PdfWriter; import org.apache.poi.hwpf.HWPFDocument; import org.apache.poi.hwpf.extractor.WordExtractor; import org.apache.poi.hwpf.usermodel.Range; import org.apache.poi.poifs.filesystem.POIFSFileSystem; public class demo { public static void main(String[] args) { POIFSFileSystem fs = null; Document document = new Document(); try { System.out.println(“Starting the test”); fs = new […]

如何使用iText以正确的顺序从PDF中提取图像？: 我试图从PDF文件中提取图像。我在网上找到了一个很好的例子： PdfReader reader; File file = new File(“example.pdf”); reader = new PdfReader(file.getAbsolutePath()); for (int i = 0; i < reader.getXrefSize(); i++) { PdfObject pdfobj = reader.getPdfObject(i); if (pdfobj == null || !pdfobj.isStream()) { continue; } PdfStream stream = (PdfStream) pdfobj; PdfObject pdfsubtype = stream.get(PdfName.SUBTYPE); if (pdfsubtype != null && pdfsubtype.toString().equals(PdfName.IMAGE.toString())) { byte[] img = […]