【项目】YOLOv5+PaddleOCR实现艺术字验证码识别

YOLOv5+PaddleOCR实现艺术字类验证码识别

  • 一、引言
    • 1.1 实现目标
    • 1.2 人手动点选验证码逻辑
    • 1.3 计算机点选逻辑
  • 二、计算机验证方法
    • 2.1 PaddleOCR下方文字识别方法
    • 2.2 YOLOv5目标检测方法
    • 2.3 艺术字分类方法
    • 2.4 返回结果
  • 三、代码获取

一、引言

1.1 实现目标

要识别的验证码类型如下图所示:
在这里插入图片描述

1.2 人手动点选验证码逻辑

以我们人输入验证码的逻辑,分为三个步骤:

  1. 首先应该观察下方的文字:请从图中以此选出“力量无限”
  2. 在上图中观察所有的艺术字及其位置
  3. 按顺序依次点击“力量无限”

1.3 计算机点选逻辑

所以当用计算机视觉的方法来点选此类验证码的过程也分为类似的四个步骤:

0.首先把原图像分为上方和下方两部分

  1. 使用PaddleOCR开源的方法识别出下方文字(下方为常规常规字体,容易识别)
  2. 使用YOLOv5检测检测的方法检测出上方所有艺术字的位置(数据集自制)
  3. 使用分类的方法识别出每个艺术字对应的文字(需要标注)
  4. 按照顺序给出四个字对应的位置

算法执行过程之所以比我们人检测步骤多一步,是因为其实人点选验证码的第二步(观察所有的艺术字及其位置),其实也等同于计算机的先观察位置,再判断艺术字对应的具体文字。

二、计算机验证方法

2.1 PaddleOCR下方文字识别方法

本文使用百度开源的OCR框架直接对整张图进行识别,由于下方文字比较规整,所以直接使用默认的OCR训练权重效果就已经很好,准确率在99%以上。
PaddleOCR链接: https://gitee.com/paddlepaddle/PaddleOCR
识别效果如下:
在这里插入图片描述
将上图中得出的文字按照规律先把引号消除,再取最后四个字符,即可得到我们需要点选的验证码文字。
此外,由于此类验证码图像比例相对固定,因此其实可以只输入验证码图像的下半部分,这样会提升模型推理速度。

2.2 YOLOv5目标检测方法

使用YOLOv5进行此类检测任务首先要搞的就是数据集了,笔者搜集了网络上一些开源数据集,并没有找到此类现成的数据集,因此就自己标注了一些,最后得到的图像样本一共是2757张,标注了821张样本,如下图所示:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
使用这些样本训练出来的算法精度可以达到95%+,算法速度与精度都很高,一些检测效果示例图如下所示

在这里插入图片描述

2.3 艺术字分类方法

第三步是艺术字分类,笔者搜集了很多网络资源,依然没有找到好用的数据集,因此也只能自己标注了。
首先把上个步骤中使用YOLO算法检测出来的目标保存起来,接着按照文件名对齐进行文字标注,最后把标注好的艺术字文件都丢进分类网络训练
在这里插入图片描述

2.4 返回结果

最后一步就是简单的逻辑步骤了,首先把PaddleOCR检测出的文字与YOLOv5检测出的艺术字进行比对,接着按照OCR给出的字符顺序返回给服务器四个艺术字的坐标位置即可。

三、代码获取

q:1831255794(有偿)
可接项目,大作业等 
价格略贵,技术够硬,认真负责,保证质量

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/757722.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c语言综合练习题

1.编写程序实现键盘输入一个学生的学分绩点 score&#xff08;合法的范围为:1.0—5.0&#xff09;&#xff0c;根据学生的学分绩点判定该学 生的奖学金的等级&#xff0c;判定规则如下表所示。 #include <stdio.h>int main() {float score;printf("请输入学生的学分…

Harbor-私有镜像仓库

目录 一、Harbor 原理说明 1.软件资源介绍 2.Harbor 特性 3.Harbor 认证过程 4.Harbor 认证流程 二、私有镜像仓库实验 1.环境准备 2.安装docker 3.配置镜像加速和私有仓库地址 4.搭建harbor仓库 5.本地windows浏览器访问配置 一、Harbor 原理说明 1.软件资源介绍 …

突破编程_C++_设计模式(访问者模式)

1 访问者模式的基本概念 C中的访问者模式是一种行为设计模式&#xff0c;它允许你在不修改类层次结构的情况下增加新的操作。这种模式将数据结构与数据操作解耦&#xff0c;使得操作可以独立于对象的类来定义。 访问者模式的主要组成部分包括&#xff1a; &#xff08;1&…

面试算法-62-盛最多水的容器

题目 给定一个长度为 n 的整数数组 height 。有 n 条垂线&#xff0c;第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线&#xff0c;使得它们与 x 轴共同构成的容器可以容纳最多的水。 返回容器可以储存的最大水量。 说明&#xff1a;你不能倾斜容器。…

CycleGAN训练及测试过程细节记录

CycleGAN训练及测试过程细节记录 文章目录 关于训练关于测试 关于训练 1、训练前将数据配置好&#xff0c;并在Pycharm中写好配置信息 2、关于训练过程的参数配置在 options/train_options.py options/base_options.py batch_size&#xff1a;批大小 crop_size&#xff1a;…

python实现--拓扑排序

拓扑排序是对有向无环图&#xff08;DAG&#xff09;进行排序的一种算法&#xff0c;它可以将图中的顶点排成一个线性序列&#xff0c;使得图中的任意一条有向边都从序列中的较早顶点指向较晚顶点。换句话说&#xff0c;如果图中存在一条从顶点A到顶点B的有向边&#xff0c;那么…

Android分区存储到底该怎么做

文章目录 一、Android存储结构二、什么是分区存储&#xff1f;三、私有目录和公有目录三、存储权限和分区存储有什么关系&#xff1f;四、我们应该该怎么做适配&#xff1f;4.1、利用File进行操作4.2、使用MediaStore操作数据库 一、Android存储结构 Android存储分为内部存储和…

【逆向】使用 Frida 进行 Android 应用程序动态分析与加密算法逆向

不愿染是与非 怎料事与愿违 心中的花枯萎 时光它去不回 回忆辗转来回 痛不过这心扉 愿只愿余生无悔 随花香远飞 &#x1f3b5; 毛不易《不染》 在移动应用程序开发中&#xff0c;保护用户数据的安全至关重要。加密算法是保护数据安全的重要手段之一。然而…

【晴问算法】提高篇—动态规划专题—最长上升子序列

题目描述 现有一个整数序列a1,a2,...,an​​​​​​&#xff0c;求最长的子序列&#xff08;可以不连续&#xff09;&#xff0c;使得这个子序列中的元素是非递减的。输出该最大长度。 输入描述 第一行一个正整数n&#xff08;1≤n≤100​​​​&#xff09;&#xff0c;表示序…

【进阶版讲解深度学习如何入门?】

深度学习如何入门&#xff1f; 1. 前言2. 学习基础知识3. 了解机器学习4. 编程和工具5. 深度学习基础6. 实战项目7. 高级概念8. 持续学习9. 推荐资源 1. 前言 深度学习是机器学习的一个子领域&#xff0c;它受到了生物神经网络的启发&#xff0c;依赖于构建多层的神经网络来学…

Windows 11 安装 Scoop

[Windows 11 安装 Scoop](Windows 11 安装 Scoop) 0. 引言 Scoop 从命令行安装您熟悉和喜爱的程序&#xff0c;差异最小。 它的主要功能如下&#xff1a; 消除权限弹出窗口 隐藏 GUI 向导样式的安装程序 防止PATH污染安装大量程序 避免安装和卸载程序的意外副作用 自动查…

算法-背包问题

问题描述 假设我有一个背包&#xff0c;希望在装得下的情况下&#xff0c;尽量装进价值更多的物品。那么我该怎么做呢&#xff1f; 问题抽象 假设背包的容量是m&#xff0c;就假设是4吧 # 表示背包容量4KG m 4 可选装进背包的物品有n个&#xff0c;物品的价值存储在prices…

支付宝手机网站支付,微信扫描二维码支付

支付宝手机网站支付 支付宝文档 响应示例 <form name"punchout_form" method"post" action"https://openapi.alipay.com/gateway.do?charsetUTF-8&methodalipay.trade.wap.pay&formatjson&signERITJKEIJKJHKKKKKKKHJEREEEEEEEEEEE…

Maven打包时报错:Cannot allocate memory

使用Jenkins执行Maven打包任务时报错 Cannot allocate memory解决办法&#xff1a; 配置系统变量 MAVEN_OPTS-Xmx256m -XX:MaxPermSize512m或者 在项目目录下新建文件 .mvn/jvm.config -Xmx256m -Xms256m -XX:MaxPermSize512m -Djava.awt.headlesstrue参考 Jenkins Maven …

MySQL 数据库设计范式

第一范式&#xff08;1NF&#xff09; 每一列都是不可分割的原子数据项第二范式&#xff08;2NF&#xff09; 在1NF的基础上&#xff0c;非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函数依赖) 1.函数依赖A->B&#xff0c;如果通过A属性(属性组)的值…

Transformer学习【从零理解】

Transformer 一、整体框架 二、Encoder 1.输入部分: &#xff08;1&#xff09;Embedding&#xff1a;将输入的词转换为对应的词向量。 &#xff08;2&#xff09;位置编码&#xff1a;因为保证输出时&#xff0c;顺序不会打乱&#xff0c;所以要加入时序信息即位置编码。 公…

如何避免AI网红经济泡沫?警惕细分行业的AI转型而不是转行

一、AI泡沫预防针 要避免AI相关新概念催生的网红经济泡沫&#xff0c;可以从多个角度采取措施&#xff1a; 1. **理性投资**&#xff1a; - 投资者应对AI项目和网红经济中的企业进行深入研究&#xff0c;了解其真实的技术实力、商业模式的可行性和盈利能力&#xff0c;而非…

代码随想录Day52:最长递增子序列、最长连续递增序列、最长重复子数组

最长递增子序列 class Solution { public:int lengthOfLIS(vector<int>& nums) {if(nums.size() < 1) return nums.size();vector<int> dp(nums.size(), 1);int res 0;for(int i 1; i < nums.size(); i){for(int j 0; j < i; j){if(nums[i] > …

初识GO语言

是由google公司推出的一门编程语言&#xff0c;12年推出的第一个版本 Go的特点 Go为什么能在最近的IT领域炙手可热 集python简洁&C语言的性能于一身 21世纪的C语言 顺应容器化时代的到来 区块链的崛起 学习一门编程语言可以划分为下面这三个步骤 安装 编译器 or 解…

JAVA多线程之synchronized锁

文章目录 1. 临界区2. synchronized使用2.1 不加锁实现2.2 synchronized加锁2.3 面向对象的改进2.4 方法上加synchronized2.5 线程安全 3. Monitor3.1 Java对象头3.2 Monitor工作流程3.3 字节码角度 4. synchronized原理4.1 轻量级锁4.2 锁膨胀4.3 偏向锁4.3.1 偏向锁过程4.3.2…