Tag: ocr

从哪里开始使用神经网络进行手写识别?

我一直在努力学习神经网络一段时间,我可以在线了解一些基本的教程。 现在我想用神经网络开发在线手写识别。 所以我不知道从哪里开始? 我需要一个非常好的指导。 最后我是java程序员。 你有什么建议我这样做?

如何以编程方式读取扫描的文档或图像

我在网上搜索过,因为在OCR方面我有点像n00b,而我实际上并不确定一个好的起点会在哪里。 我想构建一个能够识别和统计的应用程序,例如说明在文档/图像的任何给定行上填写了多少个复选框(如果有人知道更好的套件,它甚至可能是另一种格式这种类型的应用)。 最终目标是消除手动数据捕获并加快将整体统计数据提供给应用程序最终用户的过程 我主要以c#编码,所以.net解决方案会更好,但如果没有,我会采取我能得到的。 我想到的是重新设计用户填写的表格以类似于此。 (请原谅粗略的ASCII艺术:P)所以填写表格的人只需检查纸上的值。 | 1 | 2 | 3 | 4 | 5 | Product A | [ ] [ ] [ ] [ ] [x] | Product B | [ ] [ ] [x] [ ] [ ] | 任何想法将不胜感激 谢谢!

图像处理和字符提取

我正在试图找出处理角色图像所需的技术。 具体来说,在这个例子中,我需要提取带圆圈的#标签。 你可以在这里看到它: 任何实现都会有很大的帮助。

使用java中的Tesseract

我正在尝试在java中构建一个示例应用程序,它将读取图像文件并输出从图像中提取的文本。 我发现Tesseract项目看起来很有希望,但它在c ++中。 为了使用它,我应该从我的Java应用程序Runtime.exec(…)中将其作为命令行运行吗? 或者有更好的解决方案,也许是JAR? 此外,这只是一个示例应用程序,从可伸缩性的角度来看,作为命令行应用程序运行它是一个问题吗?

无法使用TesseractOCRConfig Apache Tika提取扫描的pdf

我的pdf包含扫描图像,我想从中提取文本。 我尝试过:我尝试使用AutoDetectParsers但没有输出。 我按照Apache Tika提取的扫描PDF文件提供的解决方案以及https://issues.apache.org/jira/browse/TIKA-1729上的 Apache Tika Jira,但得到空字符串没有任何错误。 我的配置:Win 7 64位操作系统,JDK 1.8.0_45。 欢迎任何forms的帮助。

检查PDF文件是否为扫描文件

以编程方式检查PDF文件是否完全扫描的最佳方法是什么? 我有iText和PDFBox供我使用。 我可以检查pdf文件是否包含文本,并根据结果来确定此文件是否为OCR,但此解决方案不是100%准确。 我想知道是否有另一种方法可以解决这个问题。 如您所知,解决方案必须基于Java。

Tess4J:内存访问无效

我试图在我的项目中使用Tess4J从图像中提取文本。 我尝试运行OCR时收到以下错误:线程“main”中的exceptionjava.lang.Error:无效的内存访问 try { File imageFile = new File(“example4.jpg”); Tesseract instance = Tesseract.getInstance(); // JNA Interface Mapping //Tesseract1 instance = new Tesseract1(); String result = instance.doOCR(imageFile); System.out.println(result); } catch (Exception e) { e.printStackTrace(); }

Apache Tika提取扫描PDF文件

我在使用Apache TIKA(版本1.10)时遇到了一些麻烦。 我得到了一些PDF文件,这些文件只是扫描过的纸片。 这意味着每个页面只是一个图像。 我的目标是提取PDF文件的文本。 我的tesseract设置正确,提取JPG和PNG文件就像一个魅力。 我正在使用的代码看起来像那样(不介意缺少的除外处理): public String extractText(InputStream stream) { AutoDetectParser parser = new AutoDetectParser(); BodyContentHandler handler = new BodyContentHandler(Integer.MAX_VALUE); Metadata metadata = new Metadata(); ParseContext context = new ParseContext(); parser.parse(stream, handler, metadata, context); String text = handler.toString(); return text; } 我搜索了很多,但我找不到任何适合我的解决方案。 我已经尝试过PDFParserConfig类的setExtractInlineImages方法,但这没有改变。 使用自定义ParsingEmbeddedDocumentExtractor提取嵌入的文档确实提取了doc文件的嵌入资源,但没有提取我的PDF文件。 如果你们中的任何人都能提供一些帮助,那真是棒极了:)

如何使用openCV或OCR tesseract从图像中提取文本?

可能重复: android OCR? 我目前正在基于Android手机中的图像捕捉进行文本识别项目。 我想问一下如何从图像中提取文本? 是否有任何openCV或OCR tesseract教程用于提取?