环境准备:
1。安装 Tesseract 模块
git文档地址:https://www.sychzs.cn/tesseract/
下载后是一个exe安装包。只需右键单击即可安装。安装完成后,配置环境变量,编辑系统变量中的路径,添加以下安装路径:
2。如果想使用其他语言,请下载相应的训练数据(我们只做中文,暂时只下载一个中文文本训练数据),然后将.traineddata文件复制到'tessdata'目录下。 C:\Program Files (x86)\Tesseract-OCR\tessdata
3。配置环境变量:
编辑系统变量中的路径,添加以下安装路径:C:\Program Files (x86)\Tesseract-OCR
在cmd命令模式下测试是否安装成功:
tesseract test.jpg text -l chi_sim
4。安装python的第三方库:
pip installpillow #一个python图像处理库,pytesseract依赖
pip install pytesseract
5。找到pytesseract安装包,C:\Python34\Lib\site-packages\pytesseract,编辑www.sychzs.cn文件(这一步一定要做,否则运行代码会报错):
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
代码示例:
简单验证码:
-->