1.在anaconda prompt中安装pytesseract和pillow: pip install pytesseract
2.安装tesseract-ocr的识别引擎/UB-Mannheim/tesseract/wiki
进行配置:需要在两个地方修改,参考/chenshengkai/p/11318272.html
查看是否安装成功:tesseract --version
修改pytesseract.py文件,‘tesseract’修改为安装tesseract-ocrde的安装目录
3.在pycharm中编写代码
图片:
代码:
from PIL import Imageimport pytesseractimage = Image.open('img/0.png')content = pytesseract.image_to_string(image) # 解析图片print(content)print("hello")
运行截图:
4.使用其他语言包
先下载语言包,可参考:/qq_38161040/article/details/90727456
下载完,直接放到安装位置的tessdata文件夹里就好了
使用时要在pytesseract库的image_to_string()方法里加个参数lang='chi_sim'