Tag: text extraction

使用iText从pdf文件中提取文本列: 我需要使用iText从pdf文件中提取文本。问题是：一些pdf文件包含2列，当我提取文本时，我得到一个文本文件，其中列被合并为结果（即同一行中两列的文本）这是代码： public class pdf { private static String INPUTFILE = “http://www.revuemedecinetropicale.com/TAP_519-522_-_AO_07151GT_Rasoamananjara__ao.pdf” ; private static String OUTPUTFILE = “c:/new3.pdf”; public static void main(String[] args) throws DocumentException, IOException { Document document = new Document(); PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(OUTPUTFILE)); document.open(); PdfReader reader = new PdfReader(INPUTFILE); int n = reader.getNumberOfPages(); PdfImportedPage page; // Go through […]

Interesting Posts

如何在Java中修复“非法表达式启动”错误？

从pdf文件中提取文本

为什么单个线程进程在多个处理器/内核上执行？

随着持续时间和模式振动

如何在java中生成XML（在String表示中）

如何在Java中获取特定年份的所有星期日？

更改JTable单元格颜色

创建无界和有界外卡类型数组之间的区别？

如何在Java中执行unsigned to signed转换？

Play-Framework 2.4：使用Spring-Depedency Injection与Play-Framework而不是Guice

JSch 0.1.53 session.connect（）抛出“IO流读取结束”

Java中是否有未处理的exception处理程序？

使用trim（）删除空格，但仍未得到预期的输出

如何解决“org.hibernate.QueryException：并未设置所有命名参数”错误？

Java编译器错误消息“ expected”是什么意思？