【原创】利用腾讯和百度的AI接口识别验证码

  众所周知,验证码在大部分的实际运用中是绕不开的问题,包括验证,爬虫,测试等等,然后解决验证码的方法也有不少,但大多数都会运用OCR。(这里说的验证码,是字符类型的验证码)

  目前要解决验证码,有以下几种方法:

  1、用OCR工具,比如tesseract-ocr;

  2、利用各类语言编写的识别库;

  3、想方法绕过验证码,这种测试中运用的多;

  前些天看见腾讯和百度都在已经搞自己的 AI LAB(实际上他们很早就开始了,并且对开发者开放了不少接口,提供使用),AI LAB包含语音识别、文字识别、图像识别,人脸识别、内容审核、数据法分析等等,然后也看到文字识别可以用来识别(字符)验证码,就想着能不能用文字识别的接口来识别验证码,也称“在线OCR”。

  说着就动手实现了,刚好公司的系统后台在登录的时候有个验证码,于是就利用selenium框架写了一个自动登录系统后台的python脚本,腾讯和百度的AI方法都可以实现了。

  首先是利用腾讯 AI 的文字识别方法(腾讯 AI:https://ai.qq.com/),选择通用识别(https://ai.qq.com/product/ocr.shtml),查看技术文档(https://ai.qq.com/doc/ocrgeneralocr.shtml),下载SDK(https://ai.qq.com/doc/sdk.shtml)(SDK只支持Python2,需要支持Python3的下载文章后面链接的代码。),目前只支持PHP和Python。这里注意下,在使用接口之前,需要注册成为开发者,创建应用获得AppID、AppKey,后面会有用到。

  实现方法和思路是截取当前的验证码,然后将截取下来的验证码传给OCR接口识别,待返回识别结果后,就将结果保存,显示在当前窗口。以下是实现方法和具体步骤:

  1)、先访问后台网站,截取验证码;

  验证码需要截取保存,不要点击,也不要刷新,不然每次请求登录的验证码都会变化。

  

  2)、截取验证码之后,传送给OCR接口;

  

  3)、在输入框中输入验证码;

  

  4)、这里需要用到的SDK,在后面的代码链接下载查看。

  利用腾讯 AI 的文字识别方法就是这样了,之后就是用百度 AI 的文字识别方法了。

  利用百度 AI 的文字识别方法(百度 AI:https://ai.baidu.com/),选择通用文字识别(https://ai.baidu.com/tech/ocr/general),查看技术文档(https://ai.baidu.com/docs#/OCR-API/top),下载SDK(https://ai.baidu.com/sdk#ocr),支持的语言要比腾讯多一些,这里选择用Python实现。使用之前一样要申请成为开发者,创建应用获得Access Token(APP_ID,API_KEY,SECRET_KEY)。

  实现方法和前面利用腾讯 AI 一样,截取和保存都是一样的,不一样的就是OCR接口传参和方法不一样,区别比较大。

  OCR验证码接口识别方法:

  

  以上就是利用腾讯和百度 AI 的文字识别在线OCR识别验证码的方法了,实现过程和方法不复杂,比本地安装一些OCR软件简单多了,而且识别率和准确率也比本地化的OCR要高不少。

  腾讯和百度的 AI 接口目前都是免费使用的,不过在使用次数上,两者有区别,但还是能够完全保证日常使用的,下面的链接的是实现的代码,IP地址和开发者账号已做了模糊化处理。

  (PS.注意腾讯 Ai 提供的SDK只支持Python2,链接下的代码已修改为Python3实现。百度的SDK支持Python3,不需要修改。)

  以上内容属于原创,转载需授权,有问题可留言。

转载于:https://www.cnblogs.com/Start12/p/9209839.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/538431.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在java中5 % 3_Java基础5

Java多线程:进程:进行中的程序线程:就是进程中一个负责程序执行的控制单元(执行单元)一个进程中可以多执行路径,称之为多线程一个进程至少一个线程开启多个线程是为了同时运行多部分代码每个线程都有自己运行的内容,这个内容成为线程要执行的任务多线程的…

scala中:: , +:, :+, :::, +++的区别

原文链接:https://segmentfault.com/a/1190000005083578 ------------------------------------------------------------- 4种操作符的区别和联系 :: 该方法被称为cons,意为构造,向队列的头部追加数据,创造新的列表。用法为 x::…

python包管理机制_Go 1.5之前的多种包管理机制简介(

在 Go 语言中,我们可以使用go get命令安装远程仓库中托管的代码,不同于 Ruby Gem、pypi 等集中式的包管理机制, Go 语言的包管理系统是去中心化的。简单来讲,go get命令支持任何一个位置托管的 Git 或 Mercurial 的仓库&#xff0…

nc命令简介

nc介绍 ncat/nc 既是一个端口扫描工具,也是一款安全工具,还能是一款监测工具,甚至可以做为一个简单的 TCP 代理。 在大多数 Debian 发行版中,nc 是默认可用的,它会在安装系统的过程中自动被安装。 但是在 CentOS 7 / R…

java时间日期工具类_java工具类--日期相关;

日期相关Date类1.通常使用的是java.util包2.导包 拿来使用 构建对象3.通常使用无参数的构造方法 或者带long构造方法4.Date类中常用的方法before(); after();setTime() getTime()compareTo(); -1 1 0;5.可以处理一个Date类型的格式DateFormat类1.包java.text 需要导包使用2.此类…

/* compiled code */ ?

原因:这是所用的ide自带了反编译工具,反编译的。不是具体的源码 具体的源码需要手动关联源码包

python判断矩阵是否对称_Python创建对称矩阵的方法示例【基于numpy模块】

本文实例讲述了Python创建对称矩阵的方法。分享给大家供大家参考,具体如下:对称(实对称)矩阵也即:step 1:创建一个方阵>>> import numpy as np>>> X np.random.rand(5**2).reshape(5, 5)>>> Xarray([…

重新学习Ubuntu -- 截图软件的选择和安装

前面两篇完成了:系统的安装和系统安装后的优化。 截图软件 shutterflameshot 这个根据自己原来的学习经验和网上的相关资料来完成截图软件的安装。参照文章: shutter :Ubuntu 18.04/LinuxMint 19中启用Shutter编辑功能 flameshot:Flameshot:你…

Scala-Actor并行wordcount

scala-2.10.6 文件: "d://word.txt", "d://word.log" 文件内容: 代码: package cn.zengmg.day26.actorimport scala.actors.{Actor, Future} import scala.collection.mutable.ListBuffer import scala.io.Sourcecase c…

小程序测试用例模板_微信小程序样式:高质量小程序样式模板大全

新手想要制作出美观的小程序,你需要多参考一些好看的微信小程序样式。今天就带大家分析几个高质量小程序的样式,看看别是怎么把小程序做得美观又吸引人的:1.电商小程序样式电商小程序首页一般是按照“图片banner - 快捷按钮 - 商品及分类”的…

Sql Server 2016数据库生成带数据的脚本

步骤:右键点击对应数据库->任务->生成脚本 在弹出的会话框中选择需要的对象,点击下一步,在设置和编写脚本选项中,点开高级按钮(如图)选择架构和数据点击确定就可以了。 提醒:如果你在数据…

深入理解Scala的隐式转换系统

原文链接:http://www.cnblogs.com/MOBIN/p/5351900.html----------------------------------------------摘要:通过隐式转换,程序员可以在编写Scala程序时故意漏掉一些信息,让编译器去尝试在编译期间自动推导出这些信息来&#xf…

python123输出最大值_Python:运行另一列的最大值?

我有一个像这样的数据帧,它跟踪特定项(ID)的值随时间的变化:mytimenp.tile( np.arange(0,10) , 2 )myidsnp.repeat( [123,456], [10,10] )myvaluesnp.random.random_integers(20,30,10*2)dfpd.DataFrame()df[myids]myidsdf[mytime]mytimedf[myvalues]myv…

Java连接MySQL

2019独角兽企业重金招聘Python工程师标准>>> <1> 在navicat中创建一个MySQL连接&#xff0c;填写连接名和密码&#xff08;密码为你配置MySQL设置的密码&#xff09; <2> 在该连接中新建一个数据库&#xff0c;填写数据库名。字符集选择&#xff08;gb-…

ssm实训报告心得_Java开发学习心得(一):SSM环境搭建

Java开发学习心得&#xff08;一&#xff09;&#xff1a;SSM环境搭建有一点.NET的开发基础&#xff0c;在学校学过基础语法&#xff0c;对JAVA有点兴趣&#xff0c;就简单学习了一下&#xff0c;记录一下从哪些方面入手的&#xff0c;暂时不打算深入到原理方面&#xff0c;先简…

Java中boolean类型占用多少个字节

原文地址&#xff1a;http://www.cnblogs.com/wangtianze/p/6690665.html?utm_sourceitdadao&utm_mediumreferral ----------------------- 为什么要问这个问题&#xff0c;首先在Java中定义的八种基本数据类型中&#xff0c;除了其它七种类型都有明确的内存占用字节数外…

java虚引用作用_深入理解Java中的引用(二)——强软弱虚引用

深入理解Java中的引用(二)——强软弱虚引用在上一篇文章中介绍了Java的Reference类&#xff0c;本篇文章介绍他的四个子类&#xff1a;强引用、软引用、弱引用、虚引用。强引用(StrongReference)强引用是我们在代码中最普通的引用。示例代码如下&#xff1a;Object o new Obje…

SQL查询表的列名

SELECT COLUMN_NAME FROM DBA_TAB_COLUMNS WHERE TABLE_NAME DT4_JOB_CHECK_MATRIX;SELECT COLUMN_NAME FROM ALL_TAB_COLUMNS WHERE TABLE_NAME DT4_JOB_CHECK_MATRIX;SELECT COLUMN_NAME FROM USER_TAB_COLUMNS WHERE TABLE_NAME DT4_JOB_CHECK_MATRIX;

java老鸟123怎么样_java入门123——一个老鸟的java学习心得.doc

java入门123——一个老鸟的java学习心得java入门123——一个老鸟的java学习心得篇一&#xff1a;java初学者学习心得学习Java心得体会学习了一学期的Java课程,觉得是该总结自己的心得体会了。开始学习任何一门课(包括java)&#xff0c;兴趣最重要。一直觉得自己在学计算机编程语…

ruby 爬虫爬取拉钩网职位信息,产生词云报告

思路&#xff1a;1.获取拉勾网搜索到职位的页数 2.调用接口获取职位id 3.根据职位id访问页面&#xff0c;匹配出关键字 url访问采用unirest&#xff0c;由于拉钩反爬虫&#xff0c;短时间内频繁访问会被限制访问&#xff0c;所以没有采用多线程&#xff0c;而且每个页面访问时间…