Articles of ocr

Tesseract使用字母子集

我在Ubuntu Linux上使用tesseract–ocr包,我已经使用了一段时间,我认为,为了提高OCR的准确性,我只需要从字母表中的一个字母的子集。 我需要的信件是: 0123456789abcdefghijklmnopqrstuvwxyz 只有这些,甚至连大写字母,都没有人给我一个指示tesseract只能匹配一个字母子集的手吗? 谢谢,

手写扫描文档到.txt文件?

有没有可以将手写扫描文档转换为txt文件的任何JAVA API或工具? 我已经尝试谷歌tesseract和其他一些工具,但我没有得到满意的结果手写扫描文档。

如何在Ubuntu / Linux发行版中安装Tesseract-OCR 3.03?

我和一个朋友对培训CV项目的tesseract-OCR引擎感兴趣。 我们尝试使用PyTesser和Pyocr等一些包装,但是结果目前并不像我们需要的那样精确。 因此,我们希望尝试培训tesseract以更好地执行我们的目的(即识别食品标签上的文本),但在安装培训工具时遇到一些麻烦。 我们已经尝试过了: 在google代码网站上,tesseract的google代码维基上的“编译”页面说,培训工具只在版本3.03上可用。 但是,tesseract-ocr的google代码“下载”页面只有3.02的材料。 “编译”页面底部也有一些关于在Windows和OSX上安装3.03版本的评论,但是对于Linux用户还没有评论。 Ubuntu似乎还有一些3.03的源码包,但我们不确定如何在我们的电脑上访问它,而“编译”页面则说我们需要运行这些命令: make training sudo make training-install 我们还发现了一个关于tesseract 3.03的谷歌小组,但是似乎这些post不包括Linux用户的build议(除非我们在最初的阅读过程中遗漏了某些东西)。 这实际上是一个非常简单的命令行安装问题? 或者,有没有一种方法火车tesseract 3.02(我们目前已经安装)? 我们一直在看错信息的地方吗? 任何意见或指导安装tesseract-ocr 3.03的Linux发行版将不胜感激! 谢谢。

开源OCR

我正在寻找在Linux上运行的开源OCR库。 我需要这个工作PNG和PDF。 大多数情况下,我想从Java或ruby接口这个库。 任何想法,如果有什么可用的? 问候。

断言失败 – 训练Tesseract

我试图用Serak Tesseract Trainer训练tesseract: https : //code.google.com/p/serak-tesseract-trainer/我不知道为什么在执行Train Tesseract时CMD中发生了下面的错误。 任何帮助? Reading a.tr … Font id = -1/0, class id = 1/46 on sample 0 font_id >= 0 && font_id < font_id_map_.SparseSize():Error:Assert failed:in file ..\classify\trainingsampleset.cpp, line 622

有什么开源解决scheme在Windows上创build可search的PDF?

我正在寻找一体化的解决scheme,通过单一步骤从纯图像PDF文件(扫描文档)创build可search的PDF文件(通过OCR)(例如,从另一个程序调用命令行) 我发现了一些软件包: pdfsandwich(很难在Windows系统上移植) watchOCR(已停产:-() 我玩的是白色的tesseract,但它只支持单个TIFF图像作为input,然后我必须将OCR结果与图像结合起来,将所有组合的页面绑定到一个新的PDF文档。 我正在编写一个基于Java的程序,检查PDF文件,如果有必要,它应该将它们转换为可search的pdf(带有文本层的pdf,通过OCR识别的图像) 如果有任何想法可以简化所有这些步骤,并将Tesseract用于以下工作stream程,那将是非常好的: 带有扫描图像的PDF =====>input(处理)输出====>带有可search文本的已识别PDF 首先十分感谢 最好的祝福 香农

我如何在小型c ++项目中使用tesseract ocr(或任何其他免费的ocr)?

所以我研究后听到的是,唯一的免费的OCR选项是Tesseract或CuneiForm。 现在,Tesseract文档是非常可怕的,他们给你的只是一堆Visual Studio代码(对于我来说,在Windows上),从那里你可以在自己的API的海洋中独自使用。 所有你能做的就是使用编译的exe,然后在tiff图像上使用它。 我期望至less有短的文档,告诉你如何拉他们的API调用使用OCR至less为一个小例子,但不,在他们的文档中没有这样的。 CuneiForm:我下载了它,“伟大”一切都是用俄语。 🙁 这些家伙真的很难拉扯一个小例子,而是提供给我们大量90%的人无法达到的不相关的信息,你怎么能到达那里,而不是从小事情开始,他们没有解释! 所以我有一堆的API,但如果解释无处,我该如何使用它?也许有人可以提供给我的build议和解决scheme? 我不是要求一个奇迹,只是一些小的东西给我看看事情是如何运作的。

mftraining给出警告:CreateIntTemplates()中没有protos / configs for F

编辑: mftraining在unicharset中的所有字符(所以不只是F,但a,b,c,d等)标题中给出的警告如何创build这些原型/configuration? 我正在学习这个教程 上一个问题现在已经解决了: – 错误:断言失败警告:在文件…. \分类\ trainingsampleset.cpp,行622没有原型/分段错误 这是整个命令+输出: C:\ training> mftraining -F font_properties -U unicharset -O eng.unicharset eng.impact.box.tr警告:没有形状表格文件present:shapetable读取eng.impact.box.tr … Font id = -1 / 0,class id = 1/103 on sample 0 font_id> = 0 && font_id <font_id_map_.SparseSize():Error:Assert failed:in file …. \ classify \ trainingsampleset.cpp,line 622 在unicharset中的所有angular色的标题中,我已经查看了所有可以find的警告,所以不仅仅是F,还有a,b,c,d等)。我不知道问题是什么,什么使它工作。 创build这些原型/configuration? 我也尝试了shapeclustering命令,但是这给了我同样的错误。 另外,当我在cygwin上运行这些时,它显示Segmentation Fault而不是断言错误。

在Windows中Tesseract OCR Android

我已阅读所有关于它的问题论坛和博客,但我仍然有一个问题。 首先,我把tess-two作为一个图书馆,我的项目也使用tess-two作为一个图书馆。 我下载了Android-NDK,并从我的项目属性中单击了构build器,然后新build – >程序,然后selectndk的ndk-build文件。 顺便说一下,我的项目是Gautam Gupta的项目。 他给了项目。 链接: https : //github.com/GautamGupta/Simple-Android-OCR 。 当我在手机中运行该项目,应用程序启动并捕获照片,但是当我按下保存然后应用程序给出下面的错误。 http://img.zgserver.com/android&usg=ALkJrhiyVHNyOx5UHzilFjaENe0g_PsdZA/qg0rl.png