【原创】利用腾讯和百度的AI接口识别验证码

  众所周知,验证码在大部分的实际运用中是绕不开的问题,包括验证,爬虫,测试等等,然后解决验证码的方法也有不少,但大多数都会运用OCR。(这里说的验证码,是字符类型的验证码)

  目前要解决验证码,有以下几种方法:

  1、用OCR工具,比如tesseract-ocr;

  2、利用各类语言编写的识别库;

  3、想方法绕过验证码,这种测试中运用的多;

  前些天看见腾讯和百度都在已经搞自己的 AI LAB(实际上他们很早就开始了,并且对开发者开放了不少接口,提供使用),AI LAB包含语音识别、文字识别、图像识别,人脸识别、内容审核、数据法分析等等,然后也看到文字识别可以用来识别(字符)验证码,就想着能不能用文字识别的接口来识别验证码,也称“在线OCR”。

  说着就动手实现了,刚好公司的系统后台在登录的时候有个验证码,于是就利用selenium框架写了一个自动登录系统后台的python脚本,腾讯和百度的AI方法都可以实现了。

  首先是利用腾讯 AI 的文字识别方法(腾讯 AI:https://ai.qq.com/),选择通用识别(https://ai.qq.com/product/ocr.shtml),查看技术文档(https://ai.qq.com/doc/ocrgeneralocr.shtml),下载SDK(https://ai.qq.com/doc/sdk.shtml)(SDK只支持Python2,需要支持Python3的下载文章后面链接的代码。),目前只支持PHP和Python。这里注意下,在使用接口之前,需要注册成为开发者,创建应用获得AppID、AppKey,后面会有用到。

  实现方法和思路是截取当前的验证码,然后将截取下来的验证码传给OCR接口识别,待返回识别结果后,就将结果保存,显示在当前窗口。以下是实现方法和具体步骤:

  1)、先访问后台网站,截取验证码;

  验证码需要截取保存,不要点击,也不要刷新,不然每次请求登录的验证码都会变化。

  

  2)、截取验证码之后,传送给OCR接口;

  

  3)、在输入框中输入验证码;

  

  4)、这里需要用到的SDK,在后面的代码链接下载查看。

  利用腾讯 AI 的文字识别方法就是这样了,之后就是用百度 AI 的文字识别方法了。

  利用百度 AI 的文字识别方法(百度 AI:https://ai.baidu.com/),选择通用文字识别(https://ai.baidu.com/tech/ocr/general),查看技术文档(https://ai.baidu.com/docs#/OCR-API/top),下载SDK(https://ai.baidu.com/sdk#ocr),支持的语言要比腾讯多一些,这里选择用Python实现。使用之前一样要申请成为开发者,创建应用获得Access Token(APP_ID,API_KEY,SECRET_KEY)。

  实现方法和前面利用腾讯 AI 一样,截取和保存都是一样的,不一样的就是OCR接口传参和方法不一样,区别比较大。

  OCR验证码接口识别方法:

  

  以上就是利用腾讯和百度 AI 的文字识别在线OCR识别验证码的方法了,实现过程和方法不复杂,比本地安装一些OCR软件简单多了,而且识别率和准确率也比本地化的OCR要高不少。

  腾讯和百度的 AI 接口目前都是免费使用的,不过在使用次数上,两者有区别,但还是能够完全保证日常使用的,下面的链接的是实现的代码,IP地址和开发者账号已做了模糊化处理。

  (PS.注意腾讯 Ai 提供的SDK只支持Python2,链接下的代码已修改为Python3实现。百度的SDK支持Python3,不需要修改。)

  以上内容属于原创,转载需授权,有问题可留言。

转载于:https://www.cnblogs.com/Start12/p/9209839.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/538431.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java时间日期工具类_java工具类--日期相关;

日期相关Date类1.通常使用的是java.util包2.导包 拿来使用 构建对象3.通常使用无参数的构造方法 或者带long构造方法4.Date类中常用的方法before(); after();setTime() getTime()compareTo(); -1 1 0;5.可以处理一个Date类型的格式DateFormat类1.包java.text 需要导包使用2.此类…

/* compiled code */ ?

原因:这是所用的ide自带了反编译工具,反编译的。不是具体的源码 具体的源码需要手动关联源码包

重新学习Ubuntu -- 截图软件的选择和安装

前面两篇完成了:系统的安装和系统安装后的优化。 截图软件 shutterflameshot 这个根据自己原来的学习经验和网上的相关资料来完成截图软件的安装。参照文章: shutter :Ubuntu 18.04/LinuxMint 19中启用Shutter编辑功能 flameshot:Flameshot:你…

Scala-Actor并行wordcount

scala-2.10.6 文件: "d://word.txt", "d://word.log" 文件内容: 代码: package cn.zengmg.day26.actorimport scala.actors.{Actor, Future} import scala.collection.mutable.ListBuffer import scala.io.Sourcecase c…

小程序测试用例模板_微信小程序样式:高质量小程序样式模板大全

新手想要制作出美观的小程序,你需要多参考一些好看的微信小程序样式。今天就带大家分析几个高质量小程序的样式,看看别是怎么把小程序做得美观又吸引人的:1.电商小程序样式电商小程序首页一般是按照“图片banner - 快捷按钮 - 商品及分类”的…

Sql Server 2016数据库生成带数据的脚本

步骤:右键点击对应数据库->任务->生成脚本 在弹出的会话框中选择需要的对象,点击下一步,在设置和编写脚本选项中,点开高级按钮(如图)选择架构和数据点击确定就可以了。 提醒:如果你在数据…

深入理解Scala的隐式转换系统

原文链接:http://www.cnblogs.com/MOBIN/p/5351900.html----------------------------------------------摘要:通过隐式转换,程序员可以在编写Scala程序时故意漏掉一些信息,让编译器去尝试在编译期间自动推导出这些信息来&#xf…

Java连接MySQL

2019独角兽企业重金招聘Python工程师标准>>> <1> 在navicat中创建一个MySQL连接&#xff0c;填写连接名和密码&#xff08;密码为你配置MySQL设置的密码&#xff09; <2> 在该连接中新建一个数据库&#xff0c;填写数据库名。字符集选择&#xff08;gb-…

ssm实训报告心得_Java开发学习心得(一):SSM环境搭建

Java开发学习心得&#xff08;一&#xff09;&#xff1a;SSM环境搭建有一点.NET的开发基础&#xff0c;在学校学过基础语法&#xff0c;对JAVA有点兴趣&#xff0c;就简单学习了一下&#xff0c;记录一下从哪些方面入手的&#xff0c;暂时不打算深入到原理方面&#xff0c;先简…

java虚引用作用_深入理解Java中的引用(二)——强软弱虚引用

深入理解Java中的引用(二)——强软弱虚引用在上一篇文章中介绍了Java的Reference类&#xff0c;本篇文章介绍他的四个子类&#xff1a;强引用、软引用、弱引用、虚引用。强引用(StrongReference)强引用是我们在代码中最普通的引用。示例代码如下&#xff1a;Object o new Obje…

ruby 爬虫爬取拉钩网职位信息,产生词云报告

思路&#xff1a;1.获取拉勾网搜索到职位的页数 2.调用接口获取职位id 3.根据职位id访问页面&#xff0c;匹配出关键字 url访问采用unirest&#xff0c;由于拉钩反爬虫&#xff0c;短时间内频繁访问会被限制访问&#xff0c;所以没有采用多线程&#xff0c;而且每个页面访问时间…

idle扩展插件_Python3.4学习笔记之 idle 清屏扩展插件用法分析

本文实例讲述了Python3.4 idle 清屏扩展插件用法。分享给大家供大家参考&#xff0c;具体如下&#xff1a;python idle 清屏问题的解决&#xff0c;使用python idle都会遇到一个常见而又懊恼的问题——要怎么清屏?在stackoverflow看到这样两种答案&#xff1a;1.在shell中输入…

内存堆和栈的区别

原文链接&#xff1a;http://www.cnblogs.com/lln7777/archive/2012/03/14/2396164.html -------------------------------------------------------------------------------- 在计算机领域&#xff0c;堆栈是一个不容忽视的概念&#xff0c;我们编写的C语言程序基本上都要用…

MYSQL安装和配置

Win10安装MySQL5.7.22 解压缩版&#xff08;手动配置 1.下载地址&#xff1a;https://dev.mysql.com/downloads/mysql/5.7.html#downloads 直接点击下载项 下载后&#xff1a; 2.可以把解压的内容随便放到一个目录&#xff0c;我的是如下目录&#xff08;放到C盘的话&#xff0…

apply()与call()的区别

一直都没太明白apply()与call()的具体使用原理&#xff0c;今日闲来无事&#xff0c;决定好好研究一番。 JavaScript中的每一个Function对象都有一个apply()方法和一个call()方法&#xff0c;它们的语法分别为&#xff1a; /*apply()方法*/ function.apply(thisObj[, argArray]…

java代码执行了两次_Java中JComboBox的itemStateChanged事件执行两次的解释

今天做项目&#xff0c;用到了JComboBox&#xff0c;即下拉列表框。为了在被选中的项发生改变时获得被选中的项&#xff0c;所以使用的ItemStateChanged事件&#xff0c;可是问题就来了&#xff0c;每次触发该事件&#xff0c;它都执行两次&#xff0c;屡试不爽。一开始以为是代…

spring与mybatis三种整合方法

原文链接&#xff1a;http://www.cnblogs.com/wangmingshun/p/5674633.html ------------------------------------------------------------------------------------------------- 1、采用MapperScannerConfigurer&#xff0c;它将会查找类路径下的映射器并自动将它们创建成…

please select a vaild python interpret

当 JetBrains PyCharm 2017.1.3 x64 遇到 please select a vaild python interpret 错误时&#xff1a; 进入PyCharm setting 选项&#xff0c;搜索 interpret

Grafana分析Nginx日志

配置Groub by -Terms时报错&#xff0c;提示需要设置fielddatatrue&#xff0c;报错内容大概如下&#xff1a; "Fielddata is disabled on text fields by default ... " 解决方法如下&#xff1a; https://www.elastic.co/guide/en/elasticsearch/reference/curren…

IDEA 更换主题

1、下载主题文件 百度或者谷歌 IDEA themes 网址有可能会变化。目前是 http://color-themes.com 选择自己喜欢的颜色&#xff0c;下载。 2、导入主题文件 File----Import Setting 导入下载的jar文件&#xff0c;一路确认&#xff0c;idea会自动重启。 3、选择主题 点击…