如何在没有Visual Studio的Windows上安装leptonica + tesseract以在Anaconda中使用?

我想从图像执行文本识别,我想使用Python。 我安装了Anaconda。 现在我想安装Tesseract,但我也需要安装Leptonica。 我没有find任何明确的指示如何在Windows中做到这一点。 对于Leptonica我不想安装Visual Studio。 那么有没有人可以提供清晰的说明如何安装leptonicatesseract在没有Visual Studio的Windows在anaconda中使用? 谢谢。

Solutions Collecting From Web of "如何在没有Visual Studio的Windows上安装leptonica + tesseract以在Anaconda中使用?"

这里有一个简单的步骤,使得tesseract 3.05 dev版本截至2016年4月22日在Windows 7和Windows 8的机器上工作:

1 – 从官方的tesseract-ocr页面安装tesseract的可执行文件(windoost版本3.02就足够了)

2-从http://domasofan.spdns.eu/tesseract/下载以下两个文件,用于tesseract 3.05 dev版本

有2个exe文件:

  • tesseract-core-yyyymmdd.exe Tesseract不含语言数据的核心应用程序
  • tesseract-langs-yyyymmdd.exe所有可用于Tesseract的语言数据。

(yyyymmdd表示年4位数,2位数字和2位数字。)

该应用程序是便携式的,所以你可以将其安装在USB棒或其他位置。

子步骤来安装这些:

  1. 下载tesseract-core和tesseract-langs软件包。
  2. 双击tesseract-core软件包并将其提取到您想要的目录(名为“Tess_temp”的临时新文件夹)。
  3. 双击tesseract-langs包并将其解压到相同的目录,但是在上面的“Tess_temp”文件夹中添加\ tessdata。 例如,如果我将tesseract-core提取到c:\ Tess_temp,则tesseract-langs需要转到c:\ Tess_temp \ tessdata。

  4. 现在将“Tess_temp”中的任何内容复制到上述步骤1中安装tesseract 3.02的位置(它通常在C:\ Program Files(x86)\ Tesseract-OCR中)(将3.02替换为3.05)

  5. 它应该现在与Windows上的3.05版本。 将示例图像test.png(带有文本)复制到此tesseract-ocr文件夹中,然后打开cmd并键入以下命令:

    转到tesseract文件夹: cd C:\Program Files <x86>\Tesseract-OCR

    在test.png上运行tesseract: tesseract -l eng test.png test_text -psm 6

它会显示你

 Tesseract Open Source OCR Engine v3.05.00dev with Leptonica 

恭喜! (检查提取的文本的test_txt.txt)