Tag: ocr

如何查找所有基于图像的PDF?

我的系统中有很多PDF文档,有时我注意到文档是基于图像的,没有编辑function。 在这种情况下,我在Foxit PhantomPDF中进行OCR以便更好地搜索,您可以在多个文件中进行OCR。 我想找到我的所有基于图像的PDF文档。 我不明白PDF阅读器如何识别文档的OCR不是文本的。 必须有一些这些读者可以访问的字段。 这也可以在终端访问。 这个答案提供了如何在线程中执行此操作的开放式建议。 检查PDF文件是否为扫描文件 : 您最好的选择可能是检查它是否有文本,还可以查看它是否包含大页面图像或覆盖页面的大量平铺图像。 如果您还检查元数据,则应涵盖大多数选项。 我想更好地理解你如何有效地做到这一点,因为如果存在一些元数据,那么它将很容易。 但是,我还没有找到这样的元素。 我认为最可能的方法是查看页面是否包含具有搜索OCR的页面化图像,因为它已经有效并且已经在一些PDF阅读器中使用。 但是,我不知道该怎么做。 边缘检测和休变换的答案 在Hugh变换中,在参数空间的超平方中有特定选择的参数。 它的复杂性$ O(A ^ {m-2})$其中m是你看到的参数数量超过那些参数的问题很难。 A是图像空间的大小。 福昕阅读器在其实现中使用最可能的3个参数。 边缘易于检测,可以确保效率,必须在Hugh变换之前完成。 简单地忽略了损坏的页面。 其他两个参数仍然未知,但我认为它们必须是节点和一些交叉点。 如何计算这些交叉点是未知的? 确切问题的表述是未知的。 测试Deajan的答案 该命令适用于Debian 8.5,但我无法在Ubuntu 16.04中最初使用它 masi@masi:~$ find ./ -name “*.pdf” -print0 | xargs -0 -I {} bash -c ‘export file=”{}”; if [ $(pdffonts “$file” 2> /dev/null | […]

从Java中的图像文件中读取文本

什么是最好的开源Java库,我可以用来从图像(JPEG,PNG)文件中提取文本?

苔丝二OCR无法正常工作

即时通讯使用tess-two在android上尝试从图像中获取文本。 但它给了我一个非常糟糕的结果 01-16 12:00:25.339: I/Tesseract(native)(29038): Initialized Tesseract API with language=spa 并在30秒后将其显示为结果字符串: {ga ., r¿ y“: A r M í :3 ‘ ‘Ev’.-:.. -: A 7 » w- ?” _ Á.» ¿”A ¿rw-V r mjÏfn ‘n’n . Y ‘ “\’ZA”.’.¡ A’ :’ïvAv- « ‘ :”Éf’Ï'” -Ï«l :’,.v:…»- . ‘ RFI’ .. ‘ g)” 3;:- 1-;4’, = […]

将训练有素的tesseract文件合二为一

我在Mac上使用最新版本的Tesseract。 我在一个文件夹中有一个eng.traineddata,在另一个文件夹中有一个eng.traineddata。 我希望将我的训练数据文件合并到一个训练有素的大字体文件中。 谁能告诉我怎么做? 我在某处读过-l命令可能就是我需要的。 谢谢!

在Java或.NET中需要开源的阿拉伯语OCR

我要求用Java或.Net或任何其他语言识别阿拉伯文字母的阿拉伯名字。 我用dotnet(Nuance)和Java(Aspose)搜索。 这两件事在评论方面都很好,但是细微差别不能为我的R和D提供试验.Aspose不支持阿拉伯语。 所以我的问题是我们是否有任何开放源代码的阿拉伯语或任何商业产品,至少有三天的试用期将阿拉伯语图像转换为文本。

为什么tesseract失败了这张图片?

我在这张图片上尝试了tesseract,并在一些矩形内部扫描了一些文字。 但它每次都以一些垃圾文本作为输出失败。 并纠正文本周围没有框。 请告诉我如何处理图像或tesseract? 请帮忙

如何提高Tesseract的OCR文本的准确性?

我创建了一个基本应用程序,用于使用Google的Tesseract API识别文本,并将其与我的相机应用程序集成。 它工作正常,但唯一的问题是准确性,因为有时文本被识别为一组随机字符,我猜准确率约为50%。 此外,当它尝试扫描图像中的四个以上的单词时,应用程序崩溃。 String ocrText = baseApi.getUTF8Text(); baseApi.end(); 其中baseApi是Tesseract API类的对象。 我是否需要使用不同的数据结构来保存已识别的文本,还是有其他原因导致超过四个单词无法识别?

日食JAVA OCR API开源

我对OCR的东西一无所知。 我只需要(如果它甚至可能)将.jar导入到Eclipse中,我可以为输入提供图像(.bmp,.tiff,.jpeg),它会输出一个包含图像文本内容的字符串。 这不是validation码或手写,只是一些字母的简单“照片”。 开源解决方案受到赞赏。 我看到像Tess4j或JavaOCR这样的项目,但它们处理起来有点复杂:( 有人有建议吗? 更新:我发现AspriseOCR非常易于使用。 只需将.jar导入构建路径并调用方法即可。 非常好! 但是……我不能在我自己的项目中使用它! 你知道任何库像Asprise一样简单(我不需要编译任何东西,或者有任何类型的培训:只需导入就可以了!)

如何从录制的监控摄像机video中读取时间?

我有一个问题,我必须从监控摄像机录制的video中读取录制时间。 时间显示在video的左上角区域。 下面是显示时间区域的屏幕抓取链接。 此外,数字颜色(白色/黑色)在video持续时间内不断变化。 http://i55.tinypic.com/2j5gca8.png 请指导我解决这个问题。 我是一名Java程序员,所以更喜欢通过Java的方法。 编辑:感谢unhillbilly的评论。 我查看了Ron Cemer OCR库,其性能远低于我们的要求。 由于ocr性能低于预期,我计划使用屏幕抓取为所有数字构建字符集,并使用一些图像/像素比较库将帧时间与将显示概率结果的字符集进行比较经过比较。 所以我一直在寻找一个好的图像比较库(我可以使用非java库,我可以使用命令行运行)。 对上述方法的任何建议都会非常有帮助。

使用OCR从Image文件中读取文本的API

我正在寻找Java中OCR(光学字符识别)的示例代码或API名称,使用它我可以从图像文件中提取所有文本。 不将它与我在代码下使用的任何图像进行比较。 public class OCRTest { static String STR = “”; public static void main(String[] args) { OCR l = new OCR(0.70f); l.loadFontsDirectory(OCRTest.class, new File(“fonts”)); l.loadFont(OCRTest.class, new File(“fonts”, “font_1”)); ImageBinaryGrey i = new ImageBinaryGrey(Capture.load(OCRTest.class, “full.png”)); STR = l.recognize(i, 1285, 654, 1343, 677, “font_1”); System.out.println(STR); } }