日食JAVA OCR API开源

我对OCR的东西一无所知。 我只需要(如果它甚至可能)将.jar导入到Eclipse中,我可以为输入提供图像(.bmp,.tiff,.jpeg),它会输出一个包含图像文本内容的字符串。 这不是validation码或手写,只是一些字母的简单“照片”。

开源解决方案受到赞赏。 我看到像Tess4j或JavaOCR这样的项目,但它们处理起来有点复杂:(

有人有建议吗?

更新:我发现AspriseOCR非常易于使用。 只需将.jar导入构建路径并调用方法即可。 非常好! 但是……我不能在我自己的项目中使用它! 你知道任何库像Asprise一样简单(我不需要编译任何东西,或者有任何类型的培训:只需导入就可以了!)

据我所知,没有本机开源Java OCR SDK。 有一些Java API包含对本机接口的调用,例如,对于最受欢迎的开源OCR引擎之一 – Tesseract( http://groups.google.com/group/tesseract-ocr/ ) – 有一些像Java包装器一样tesjeract( http://code.google.com/p/tesjeract/ )或Tess4J( http://tess4j.sf.net/ )。 这可能对你有用,但设置起来相当困难,需要开发图像预处理和字体训练。

另一个解决方案可能是云服务。 它要求最终用户应用程序具有Internet连接,但它独立于您的编程语言选择和资源限制。 看看http://ocrsdk.com ,它是一个基于云的OCR SDK,可让您通过Web API上传图像并返回OCRed数据。 这个基于Web API的OCR SDK不是免费的,可能不适合你,但我仍然建议你试一试(它有一个免费试用版),因为与企业级解决方案相比,它的价格实惠,而它提供了企业级OCR准确性比开源更好。 您还可以在github上找到有用的Java代码示例 。 免责声明:我在@ ABBYY工作。

你可以看看javaocr和sourceforge.net/projects/ajol 。