当前位置:  开发笔记 > 编程语言 > 正文

pytesseract找不到指定的文件

如何解决《pytesseract找不到指定的文件》经验,为你挑选了1个好方法。

我的代码很简单,如下:

import pytesseract
from PIL import Image

img = Image.open('C:/temp/foo.jpg')
img.load()
i = pytesseract.image_to_string(img)

我得到的错误响应是:

Traceback (most recent call last):
  File "img.py", line 6, in 
    i = pytesseract.image_to_string(img)
  File "build\bdist.win32\egg\pytesseract\pytesseract.py", line 161, in image_to
_string
  File "build\bdist.win32\egg\pytesseract\pytesseract.py", line 94, in run_tesse
ract
  File "C:\Users\%USER%\AppData\Local\Continuum\Anaconda\lib\subprocess.py",
line 710, in __init__
    errread, errwrite)
  File "C:\Users\%USER%\AppData\Local\Continuum\Anaconda\lib\subprocess.py",
line 958, in _execute_child
    startupinfo)
WindowsError: [Error 2] The system cannot find the file specified

任何指导都会很棒.

将tesseract添加到我的路径变量有助于: C:\Program Files (x86)\Tesseract-OCR

但是在尝试运行pytesseract时,代码现在崩溃了.



1> MaxU..:

刚刚遇到同样的错误并决定回答这个问题 - 这可能有助于节省时间......

首先,确保已安装/复制Tesseract-OCR可执行文件.

Windows无法tesseractPATH环境变量中指定的目录中找到可执行文件.因此要么确保包含的目录在Python脚本tesseract中的PATH变量或覆盖tesseract_cmd变量中,如下所示(改为放置PATH):

import pytesseract

pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

除此之外,请确保将TESSDATA_PREFIX Windows环境变量设置为包含tessdata目录的目录.例如:

TESSDATA_PREFIX=C:\Program Files (x86)\Tesseract-OCR

如果tessdata位置是:C:\Program Files (x86)\Tesseract-OCR\tessdata


为了评论,我鼓励安装tesseract FIRST然后尝试python部分.
@jasonm,我已经更新了我的答案.实际上我觉得提起它太明显了,但是,嘿,你是对的 - 它可能会让一些没有经验的用户感到困惑.
推荐阅读
云聪京初瑞子_617
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有