将训练有素的tesseract文件合二为一
我在Mac上使用最新版本的Tesseract。 我在一个文件夹中有一个eng.traineddata,在另一个文件夹中有一个eng.traineddata。 我希望将我的训练数据文件合并到一个训练有素的大字体文件中。
谁能告诉我怎么做? 我在某处读过-l命令可能就是我需要的。
谢谢!
Tesseract不会在两个不同的文件夹中查找语言数据。 您可以做的是重命名其中一个,例如,重命名为eng1.traineddata
,然后将它们指定为tesseract
命令的-l eng+eng1
选项。
我也尝试过,但似乎只有在我们通过同时编译多个图像创建训练的数据文件时才有可能。 这是详细的程序….
“ https://printalert.wordpress.com/2014/10/28/tesseract-training-more-fonts/ ”