推荐专题：

700字范文 > Python+Tesseract-OCR识别图片文字并保存到word文档

Python+Tesseract-OCR识别图片文字并保存到word文档

时间：2019-01-07 11:11:30

相关推荐

Python+Tesseract-OCR识别图片文字并保存到word文档

目录

使用Python+Tesseract-OCR识别图片文字并保存到word文档安装Tesseract-OCR配置Tesseract-OCR通过CMD验证Tesseract-OCR工作安装pytesseract代码示例示例验证注意事项示例图片结果展示学习过程小结

使用Python+Tesseract-OCR识别图片文字并保存到word文档

本文通过使用Tesseract-OCR进行图片文本识别。并通过python进行后续处理把识别的文本保存到word文档。本文仅作为入门，由于对于中文图片的识别率并不高，需要后续优化。

安装Tesseract-OCR

Tesseract是一个开源文本识别引擎，通过Apache 2.0授权可用。可以直接使用，或者通过接口编程从图片提取文本，该引擎广泛支持各种语言，本文以Python为例说明：

去Windows安装包下载页面，选择需要的位数版本.运行安装包，一路下一步直至安装完成；

配置Tesseract-OCR

添加安装目录到系统环境变量path，比如：

//添加安装目录到系统pathC:\Program Files (x86)\Tesseract-OCR;

通过CMD验证Tesseract-OCR工作

安装pytesseract

//cmd运行下列命令pip install pytesseract

代码示例

from PIL import Imageimport pytesseractimport osimport iotessdata_dir = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'txt = pytesseract.image_to_string(Image.open('./img/0804.jpg'), lang='chi_sim', config=tessdata_dir)print(txt)if not os.path.exists('./result'):os.mkdir('./result')with io.open('./result/test.doc', 'w') as fp:fp.write(txt)

示例验证注意事项

中文图片需要使用参数lang=‘chi_sim’

图片路径可自己设定，比如：D:/test.jpg

如果安装Tesseract-OCR时未安装该数据包，可重新运行安装程序，并选择额外的语言包进行安装

为避免系统变量设置问题程序不能找到训练数据，建议设置tessdata_dir参数

~~print(txt)~~为调试使用，可删除或者注释掉

示例图片

结果展示

识别率不够高，需要继续优化，希望有高手指点（抱拳）

学习过程小结

学习流程图：

Actions speak louder than words.

210 = 1024.

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

Python图片文字识别——Windows下Tesseract-OCR的安装与使用

2023-04-20

word中识别图片文字简短 word文档识别图片文字(四篇)

2022-10-18

提取Word文档中的Excel附件并识别文件名保存

2024-02-02

怎样将图片格式的PDF文档变成word 文字识别

2022-03-25

扩展阅读

: 如何导出微信聊天记录形成word文档并永久保存

: 使用Python+百度OCR文字识别提取图片内容

: 使用Python制作一个简易的OCR图片文字识别工具

: word版面设计技巧：设置公司专用页眉页脚并保存到文档部件库

: Python调用百度AI制作简易OCR图片文字识别工具（完结篇）

: Python调用百度AI制作简易OCR图片文字识别工具（完结篇）

最近发布

妈妈爱我的作文700字

2024-09-23

我心目中的老师和同学700字作文素材大全

2024-09-23

小小辩论家：激烈辩论赛中的小学生们

2024-09-23

【欢乐考试时刻：700字搞笑祝福短信】

2024-09-23

探讨善良的魅力：一篇700字论文

2024-09-23

幸福的守候作文700字

2024-09-23

推荐专题

写人700字关于雨的作文700字我懂得了珍惜700字名人传读后感700字为自己喝彩作文700字责任作文700字温暖700字我的同学700字作文他传700字挑战困难作文700字有关成长的作文700字初二游记作文700字难忘的事作文700字 700字日记美文700字