Tag: tesseract

Windows中的Tess4j问题:java.lang.UnsatisfiedLinkError:在instance.doOCR(imageFile)中找不到指定的模块

经过2天的谷歌搜索后,我仍无法找到Tess4j 3.0版的问题解决方案:java.lang.UnsatisfiedLinkError:找不到指定的模块。 我在Windows 10 x64上编写服务器端Spring启动应用程序。 我使用本教程http://tess4j.sourceforge.net/tutorial/我在tess4j项目的源代码中进行了ant test ,这个命令在我的电脑上运行正常。 我还安装了VS2012的Visual C ++ Redistributable和VS2013的Visual C ++ Redistributable。 但我错过了我的电脑中的dll,libtesseract304.dll取决于: 这可能是问题的原因吗? 但是如何可能,Tess4J-3.0-src项目在我的电脑上运行正常? 我的完整堆栈跟踪: java.lang.UnsatisfiedLinkError: The specified module could not be found. at com.sun.jna.Native.open(Native Method) ~[jna.jar:4.2.1 (b0)] at com.sun.jna.NativeLibrary.loadLibrary(NativeLibrary.java:263) ~[jna.jar:4.2.1 (b0)] at com.sun.jna.NativeLibrary.getInstance(NativeLibrary.java:403) ~[jna.jar:4.2.1 (b0)] at com.sun.jna.Library$Handler.(Library.java:147) ~[jna.jar:4.2.1 (b0)] at com.sun.jna.Native.loadLibrary(Native.java:502) ~[jna.jar:4.2.1 (b0)] at com.sun.jna.Native.loadLibrary(Native.java:481) ~[jna.jar:4.2.1 (b0)] at net.sourceforge.tess4j.util.LoadLibs.getTessAPIInstance(Unknown Source) […]

JAVA Tess4j doOCR()不工作,exception“内存访问无效”

我在eclipse中的动态Web项目中工作,我创建了一个包含以下内容的TesseractOCR类: public class TesseractOCR { public TesseractOCR() { } public String doOCR(String file) { System.setProperty(“jna.library.path”, “32”.equals(System.getProperty(“sun.arch.data.model”)) ? “lib/win32-x86” : “lib/win32-x86-64”); File imageFile = new File(“C:\\Users\\Sherein Dabbah\\Downloads\\ca096-d7a6d799d7a1d798d799d7a72.jpg”); Tesseract instance = Tesseract.getInstance(); // JNA Interface Mapping Tesseract1 instance1 = new Tesseract1(); instance.setLanguage(“heb+eng”); // Tesseract1 instance = new Tesseract1(); // JNA Direct Mapping // File tessDataFolder = LoadLibs.extractTessResources(“tessdata”); […]

通过命令行与JNI进行调用

我需要从Java应用服务器调用tesseract OCR(它是一个用C ++进行光学字符识别的开源库)。 现在,它很容易使用Runtime.exec()运行可执行文件。 基本逻辑是 将当前保存在内存中的图像保存到文件(a .tif) 将图像文件名传递给tesseract命令行程序。 使用FileReader从Java读取输出文本文件。 通过为Tesseract编写JNI包装器,我可以获得多少性能提升? 不幸的是,没有一个可在Linux中运行的开源JNI包装器。 我必须自己做,并且想知道这个好处是否值得开发成本。

识别java中图像中的数字

我想识别下图中的数字 我目前在eclipse java项目中使用Tess4J库,但它只能识别平面颜色背景中的字符。 对于此图像,它甚至无法识别此图像上是否有字符(数字)。 帮我找到完成这项任务的方法。 这是我目前的代码: import net.sourceforge.tess4j.*; import java.io.File; public class Main { public static void main(String[] args) { File imageFile = new File(“image.png”); Tesseract instance = Tesseract.getInstance(); try { String result = instance.doOCR(imageFile); System.out.println(result); } catch (TesseractException e) { System.err.println(e.getMessage()); } } } 如果有办法计算黄线分隔的方块。 Thank you

获取UnsatisfiedLinkError:创建TessBaseAPI时java.library.path中没有jnilept

我是java cpp和tesseract-ocr的新手。 几个小时后我遇到了一个问题。 我在创建TessBaseAPI时遇到了UnsatisfiedLinkError:java.library.path中没有 jnilept。 下面是我的代码。 public static void tesseractForPdf(String filePath) throws Exception { BytePointer outText; TessBaseAPI api = new TessBaseAPI();//getting the UnsatisfiedLinkError exception here. // Initialize tesseract-ocr with English, without specifying tessdata path if (api.Init(“.”, “ENG”) != 0) { System.err.println(“Could not initialize tesseract.”); System.exit(1); } // Open input image with leptonica library PIX image […]

Windows 64位上的Tess4j:multithreading上的exception

我在Windows 64位上使用tesseract 3和Java 8到OCR扫描的PDF。 我已按照Tess4j页面上的说明操作并使用了所需DLL的64位版本,并安装了64位Ghostscript。 当我使用正常的@Test(无参数)运行我的unit testing时, 代码运行正常 ,所以我想我已经正确安装了所有内容。 当我用2个并行线程运行它时(见下文)我得到一个例外。 我已经在这里阅读了相关的主题,但是建议使用我正在使用的Tesseract1(我已经尝试过)。 有任何想法吗? 这是代码: // @Test // works @Test(invocationCount = 2, threadPoolSize = 2) public void testOcr() throws OcrException, TesseractException { File scannedPdf = new File(this.getClass().getClassLoader().getResource(“scanned.pdf”).getFile()); // Tesseract instance = Tesseract.getInstance(); // JNA Interface Mapping Tesseract1 instance = new Tesseract1(); // JNA Direct Mapping String str […]

应用程序中的Android JNI DETECTED ERROR:JNI GetMethodID被调用挂起exception

我正在尝试用我的android项目运行Googles OCR Tesseract。 我已经用android-ndk编写了tesseract,并在我尝试运行android项目后收到此错误。 我的环境如下 Android 5.1.1 android-ndk-r10e for windows Android的SDK-R22 作为参考,我是根据此处列出的示例链接示例构建的 提前致谢! 这是我的logcat结果的片段: I/DEBUG ( 182): Revision: ‘0’ I/DEBUG ( 182): ABI: ‘arm’ I/DEBUG ( 182): pid: 20291, tid: 20337, name: JavaBridge >>> com.enterprisem obility.OCR <<< I/DEBUG ( 182): signal 6 (SIGABRT), code -6 (SI_TKILL), fault addr ——– I/DEBUG ( 182): Abort message: 'art/runtime/check_jni.cc:65] […]

netbeans中的libtesseract303.dll问题

我正在实施一个OCR系统。 当我将dll文件放在java类路径上时,它会出现以下错误。 Exception in thread “main” java.lang.UnsatisfiedLinkError: G:\software\apache-tomcat-8.0.18-windows-x64\apache-tomcat-8.0.18\bin\win32-x86-64\libtesseract303.dll: Can’t find dependent libraries 在运行项目后,如果我检查java类路径,则添加的所有dll文件都将消失。 我几乎遵循了与tesseract相关的所有教程。 但找不到解决方案。 有人有想法吗? 1).JDK版本-1.8(64位)2).Library是64位3)。所有三个库都放在库路径中。 4)我遵循本教程给出的步骤。在本教程中,他们介绍了32位库。而不是我使用64位库。我得到了以下错误java.lang.UnsatisfiedLinkError:无法加载库’libtesseract304′ :资源路径中找不到本机库(win32-x86-64 / libtesseract303.dll)([file:/ C:/ Users / User / Documents / GitHub / Linguist / build / web / WEB-INF / classes) 。 然后我尝试检查是否可以使用system.load()加载库。 然后我得到以下错误。 我的类路径放在tomcat文件夹中。 线程“main”中的exceptionjava.lang.UnsatisfiedLinkError:G:\ software \ apache-tomcat-8.0.18-windows-x64 \ apache-tomcat-8.0.18 \ bin \ win32-x86-64 \ libtesseract303.dll:可以找不到依赖的库

苔丝二OCR无法正常工作

即时通讯使用tess-two在android上尝试从图像中获取文本。 但它给了我一个非常糟糕的结果 01-16 12:00:25.339: I/Tesseract(native)(29038): Initialized Tesseract API with language=spa 并在30秒后将其显示为结果字符串: {ga ., r¿ y“: A r M í :3 ‘ ‘Ev’.-:.. -: A 7 » w- ?” _ Á.» ¿”A ¿rw-V r mjÏfn ‘n’n . Y ‘ “\’ZA”.’.¡ A’ :’ïvAv- « ‘ :”Éf’Ï'” -Ï«l :’,.v:…»- . ‘ RFI’ .. ‘ g)” 3;:- 1-;4’, = […]

为什么tesseract失败了这张图片?

我在这张图片上尝试了tesseract,并在一些矩形内部扫描了一些文字。 但它每次都以一些垃圾文本作为输出失败。 并纠正文本周围没有框。 请告诉我如何处理图像或tesseract? 请帮忙