Mac python Tesseract 验证码识别

Tesseract

简介

Tesseract(/'tesərækt/) 这个词的意思是"超立方体",指的是几何学里的四维标准方体,又称"正八胞体"。不过这里要讲的,是一款以其命名的开源 OCR(Optical Character Recognition, 光学字符识别) 软件。

所谓 OCR 是图像识别领域中的一个子领域,该领域专注于对图片中的文字信息进行识别并转换成能被常规文本编辑器编辑的文本。

在 1995 年 Tesseract 曾是世界前三的 OCR 引擎,而且在现在的免费 OCR 引擎中,其识别精度也仍然是出类拔萃的。因为其免费与较好的效果,许多的个人开发者以及一些较小的团队在使用着 Tesseract ,诸如验证码识别、车牌号识别等应用中,不难见到 Tesseract 的身影。

程序安装

安装PIL

 pip install Pillow

安装Tesseract

pip install tesseract

安装pytesseract

pip install pytesseract

 

编写程序

import pytesseract
from PIL import Imageimage = Image.open('code1.png')vcode = pytesseract.image_to_string(image)
print(vcode)

图片

 

运行程序报如下错误

pytesseract.pytesseract.TesseractError

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file /usr/local/Cellar/tesseract/3.05.01/share/tessdata/chi_sim.traineddata 
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. 
Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')

处理办法如下:

安装tesseract-ocr

分别下载 

tesseract-ocr  和  tesseract-ocr语言包

下载解压后放到 site-packages/tesseract/即可

如下图

 

添加环境变量

如下图 

 

 

 

再次执行程序如下

 

 

中文识别遇到如下错误

 

需要添加语言包chi_sim

 

如上图,注意我这里是3.0.1的,所以要添加比这个版本小的文件,添加了3.0.4或5的都不行。

 

 

转载于:https://www.cnblogs.com/BlueSkyyj/p/9481178.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/367762.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

构建器模式:适用于代码,适用于测试

我发现生成器设计模式偶尔在代码中有用,但在测试中经常有用。 本文简要概述了该模式,然后介绍了在测试中使用该模式的一个有效示例。 请参阅github中的代码。 生成器模式的背景 根据GoF的书 ,构建器设计模式用于“将复杂对象的构造与其表示分…

如何判断html页面停止滚动?

写在开始的话 查遍的文献,没有找到js或者jquery定义好的方法可用,最后迫不得已自己写了个方法。(如果哪位同学知道有其他方法,欢迎讨论) 代码 var count_index 0;$(window).scroll(function(e) {if(count_index 0) {…

HTML5教程之-文件拖拽功能实现

现在打开优酷的网站我们再观看视频时如果拖动滚动条,页面会自动出现一个小的播放窗口,而这个播放窗口是可以说随便拖拽的。这种对图片或者链接的拖拽效果是怎么实现的?其实用HTML5就很容易实现了,因为HTML5中有个html5中默认对图片…

php 打乱数组顺序_PHP实现大转盘抽奖算法

php中文网最新课程每日17点准时技术干货分享本文通过具体的实例向大家介绍了PHP语言实现大转盘抽奖算法,希望对大家学习PHP抽奖有所帮助。流程:1.拼装奖项数组;2.计算概率;3.返回中奖情况。代码如下:中奖概率 v 可以…

linux线程基础篇----线程同步与互斥

linux线程基础----线程同步与互斥 一、同步的概念 1.同步概念 所谓同步,即同时起步,协调一致。不同的对象,对“同步”的理解方式略有不同。如,设备同步,是指在两个设备 之间规定一个共同的时间参考;数据库同…

分布式系统开发注意事项

开发分布式软件系统时,要考虑许多因素。 如果您甚至不知道第一句话中我在说什么,那么让我为您提供一些见解,示例以及有关分布式系统的实例。 总览 分布式系统是指多个物理硬件设备与单独的离散用户交互并通过这些硬件设备协作以为这些离散的…

只需5步,轻松创建HTML5离线应用

1 – 添加 HTML5 doctype第一件要做的事情是创建一个符合规范的 HTML5 文档。HTML5 doctype 相比于 xhtml 版本的 doctype 而言&#xff0c;要简单明了得多&#xff1a; <!DOCTYPE html><html> ...创建一个名为 index.html 的文档&#xff0c;或者猛击这里下载这份…

软工读书笔记 week 1

这次读书笔记主要是就《程序员修炼之道》这本书的前半部分做一些总结以及发表一些自己的看法。 本书前面的一部分主要是一些程序员应该在工作中时刻注意的事情&#xff0c;一些关键的信息如下&#xff1a; 1、处理问题的态度与责任。 这是在本书序言中就提到的&#xff0c;可见…

mysql脚本解读_一篇很好的关于mysqld_safe脚本源码解读的文章,收藏了!!

#!/bin/sh# 一些状态变量的定义KILL_MYSQLD1; # 试图kill多余的mysqld_safe程序&#xff0c;1表示需要killMYSQLD# mysqld二进制可执行文件的名称niceness0# 进程的调度优先级标识# 下面的变量主要用于标识不使用错误日志和sysloglogginginit # 日志记录状态&#xff0c;init代…

Java EE 7发布–反馈和新闻报道

Java EE 7已经存在了几天。 我们所有人都有机会观看直播活动或可用的重播 。 最后的MR版本完成了将他们的工作推向JCP的过程&#xff0c;基本上是一个总结。 是时候反思发生的事情以及我对此的想法了。 启动活动中的社区参与 这不是一个大秘密。 即使Oracle的Java EE 7发行可以…

进制转换器

1 /*2 进制转换器 3 P进制数x转为Q进制数z4 过程模拟&#xff0c;先转十进制再转目标进制 5 */6 #include<cstdio> 7 #include<algorithm>8 #include<stack>9 using namespace std; 10 int main(){ 11 int p,q; 12 int x,y0,z; 13 int a1; 14 …

HTML5中的本地数据库-Web SQL Database

html5增加新的特性&#xff0c;那就是增加了本地存储&#xff01;改善用户体验&#xff0c;或许html5会带着我们走进新的互联网时代。 下面看看怎样操作web 数据库吧&#xff01;&#xff01;首先新建数据库&#xff01; var db window.openDatabase("mydata", &quo…

使用Apache CXF开发SOAP Web服务

在上一篇文章中&#xff0c;我逐步介绍了使用apache CXF开发简单的RESTFull服务的步骤。 在本文中&#xff0c;我将讨论使用CXF开发SOAP Web服务。 在继续前进之前&#xff0c;让我们了解构成SOAP Web服务的一些概念/元素。 SOAP或简单对象访问协议 SOAP是一种协议&#xff0c…

pkill mysql_每天一个linux命令:kill命令

终止一个进程或终止一个正在运行的程式&#xff0c;一般是通过kill 、killall、pkill、xkill 等进行。比如一个程式已死掉&#xff0c;但又不能退出&#xff0c;这时就应该考虑应用这些工具。另外应用的场合就是在服务器管理中&#xff0c;在不涉及数据库服务器程式的父进程的停…

HTML5中如何检查浏览器是否支持本地存储

如果你的浏览器支持该特性的话&#xff0c;那么全局对象&#xff1a;window上会有一个localStorage的属性&#xff0c;反之&#xff0c;你的浏览器不支持的话&#xff0c;那么该属性值为undefinedJavaScript function supports_local_storage(){ return !!window.localStorage…

解决swiper-slide在ion-slide-box不滑动的问题(暂且这么描述)

1&#xff0c;开发环境ionic1angularjs1 嗯对的版本都是最低版本 页面结构想要完成的功能是这样的&#xff08;比较丑 &#xff0c;不接受批评&#xff0c;捂脸&#xff09; 大致如图 代码结构&#xff1a; <ion-slide-box><ion-slide> //列表 <div class"…

java趣味题-打印99乘法表

java趣味题-打印99乘法表 public class First102 { public static void main(String[] args) { for(int i1;i<9;i){ for(int j1;j<i;j){ System.out.print(i"*"j""i*j" "); } System.out.println(""); } } }posted…

MOXy的@XmlVariableNode – JSON模式示例

我们正在向EclipseLink MOXy添加从域模型生成JSON模式的 功能 。 为此&#xff0c;我们创建了一个新的变量节点映射。 在本文中&#xff0c;我将通过将Java模型映射到JSON模式来演示新的映射。 您可以使用每晚构建的EclipseLink 2.6.0进行尝试&#xff1a; http://www.eclips…

在HTML5中如何利用Canvas处理并存储图片

HTML5中增加的Canvas元素&#xff0c;配合JS灵活的语法&#xff0c;处理起图片变得异常简单&#xff0c;不需要在客户端用C/C 写一大堆代码&#xff0c;对于熟悉JS的程序员来说&#xff0c;只需要考虑处理图片的逻辑了。 canvas中如果想要处理图片就需要借助ImageData这个对象&…

python正则表达式research_八Python正则表达式

正则表达式是搜索、替换和解析复杂字符串的一种强大而标准的方法&#xff0c;Python中的正则相关的东西全在re模块下。1 常用的匹配^匹配字符串的开始$匹配字符串的结尾\b匹配一个单词的边界\d匹配任意数字\D匹配任意非数字字符x?匹配一个可选的x(匹配1次或0次x字符)x*匹配0次…