《深度学习》【项目】 OpenCV 身份证号识别

目录

一、项目实施

1、自定义函数

2、定位模版图像中的数字

1)模版图二值化处理

运行结果:

2)展示所有数字

 运行结果:

3、识别身份证号

1)灰度图、二值化图展示

运行结果

2)定位身份证号每一个数字

运行结果:

3)取出身份证号每一个数字

运行结果:

4)使用模板匹配计算匹配得分

运行结果:

二、总结

1、关于图像识别

2、在图像识别任务中,通常包括以下几个步骤:

3、应用领域


一、项目实施

1、自定义函数

        用于展示图像以及获取输入的轮廓图像的排序结果和边界信息

def cv_show(name, image):   # 输入两个参数,图像名和图像地址即可展示图像cv2.imshow(name, image)cv2.waitKey(0)import cv2
def sort_contours(cnts ,method='left-to-right'):   # 输入参数轮廓列表,以及method,默认排序方式为由左到右reverse = False  # 布尔值,用于控制排序的方向i = 0if method == 'right-to-left' or method == 'bottom-to-top':  # 判断排序方式,以此来更改reversereverse=Trueif method == 'top-to-bottom' or method == 'bottom-to-top':i = 1boundingBoxes = [cv2.boundingRect(c) for c in cnts]  # 遍历每一个轮廓图,取出轮廓图的x、y、w、h,将这些信息存放到空列表中# 将列表轮廓和轮廓信息组合成一个元组的列表,再通过匿名函数排序这个元组列表,排序依据为轮廓数据的第一位x大小,降序方式,返回两个元素,一个是排序后的轮廓列表,一个是轮廓的边界框(cnts,boundingBoxes) = zip(*sorted(zip(cnts,boundingBoxes),key=lambda b:b[1][i],reverse=reverse))return cnts,boundingBoxes

2、定位模版图像中的数字

        1)模版图二值化处理
img = cv2.imread("shuzi.png")   # 导入模版图像
cv_show('img', img)   # 展示原图
gray = cv2.imread("shuzi.png", 0)   # 读取模版图的灰度图
ref = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY_INV)[1]  # 对灰度图进行二值化处理,灰度值大于150的将其改变为255,小于150的改变为0
cv_show('ref', ref)   # 展示二值化图像
            运行结果:

        2)展示所有数字
# 计算轮廓: cv2.findContours()数接受的参数为二值图,即黑白的(不是灰度图)
# cv2.RETR_EXTERNAL 只检测外轮廓,cv2.CHAIN_APPRO_SIMPLE只保留端点坐标
_,refCnts, hierarchy = cv2.findContours(ref.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cv2.drawContours(img, refCnts, -1, (0, 255, 0), 2)  # 绘制轮廓
cv_show('img', img)
#
refCnts = sort_contours(refCnts, method='left-to-right')[0]   # 调用自定义函数,对轮廓图像进行排序,返回排序后图片以及轮廓的边界信息(x,y,w,h)
# 保在模板中每个数字对应的像素值
digits = {}
for (i, c) in enumerate(refCnts):   # 使用函数enumerate返回可迭代器的索引和其对应的值(x, y, w, h) = cv2.boundingRect(c)   # 计算轮廓的外接矩形,返回矩形的边界信息roi = ref[y - 2 : y + h + 2, x - 2 : x + w + 2]  # 裁剪出每个数字对应的图像roi = cv2.resize(roi, (57, 88))   # 将裁剪出来的图像进行缩放,尺寸变成(57,88)roi = cv2.bitwise_not(roi)  # 对每个数字进行按位取反运算,即灰度值255变成0,0变成255cv_show('roi',roi)   # 展示取反后的图像digits[i] = roi   # 将每个轮廓存入字典
cv2.destroyAllWindows()   # 关闭所有图像
            运行结果:

3、识别身份证号

        1)灰度图、二值化图展示
img = cv2.imread('./shenfen.jpg')
imgg=img.copy()
cv_show('img', img)gray = cv2.imread('./shenfen.jpg', 0)  # 灰度图
cv_show('gray', gray)ref = cv2.threshold(gray, 120, 255, cv2.THRESH_BINARY_INV)[1]   # 二值化
cv_show('ref', ref)

            运行结果

        2)定位身份证号每一个数字
# # 计算轮廓: cv2.findContours()数接受的参数为二值图,即黑白的(不是灰度图)
# # CV2.RETR_EXTERNAL 只检测外轮廓,CV2.CHAIN_APPROX_SIMPLE只保留端点坐标
_,refCnts, hierarchy = cv2.findContours(ref.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)  # 识别身份证图片所有轮廓
a = cv2.drawContours(img.copy(), refCnts, -1, (0, 255, 0), 2)   # 绘制轮廓
cv_show('img', a)
#
# cv2.destroyAllWindows()
#
# # 遍历轮廓,找到数字部分像素区城
locs = []
for (i, c) in enumerate(refCnts):   # 遍历每一个轮廓及其对应索引(x, y, w, h) = cv2.boundingRect(c)  # 计算外接矩形边界信息# 选择合适的区域,根据实际任务来if (y > 330 and y < 360) and x > 220:  # 判断轮廓的坐标位置,留下身份证号位置的信息,此处位置信息需要自己结合原图像素值进行判断locs.append((x, y, w, h))   # 满足上述条件的为身份证号每一个数字的轮廓locs = sorted(locs, key=lambda x: x[0])   # 对身份证号按照x的值进行进行排序

            运行结果:

        3)取出身份证号每一个数字
import numpy as npoutput = []
for (i, (gX, gY, gW, gH)) in enumerate(locs):  # 遍历每一个数字的边界信息及其对应的索引groupOutput = []group = gray[gY - 2 : gY + gH + 2, gX - 2 : gX + gW + 2]  # 对每个数字的轮廓适当加一点边界,gray为上述的身份证灰度图cv_show('group',group)   # 绘制边界# 预处理group = cv2.threshold(group, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]  # 二值化每个数字的轮廓图cv_show('group',group)roi = cv2.resize(group, (57, 88))   # 对每个数字做缩放处理cv_show('roi',roi)
        运行结果:

        4)使用模板匹配计算匹配得分
    scores = []# 在模板中计算每一个得分for (digit, digitROI) in digits.items():  # 遍历每一个数字模版及其对应的数值# 模板匹配result = cv2.matchTemplate(roi, digitROI, cv2.TM_CCOEFF)  # 对上述识别出来的身份证号图与数字模版进行匹配(_, score, _, _) = cv2.minMaxLoc(result)    # # 找到上述模板匹配相关系数最大值,只要score,其他返回值忽略scores.append(score)   # 将最大值增加到列表# 得到最合适的数字groupOutput.append(str(np.argmax(scores)))   # 取出最大值对应的数字存入列表# 绘制每个数字的矩形边框cv2.rectangle(imgg, (gX - 5, gY - 5), (gX + gW + 5, gY + gH + 5), (0, 0, 255), 1)# cv2.putText()是OpenCV库中的一个函数,用于在图像上添加文本。cv2.putText(imgg, "".join(groupOutput), (gX, gY - 15), cv2.FONT_HERSHEY_SIMPLEX, 0.65, (0, 0, 255), 2)output.extend(groupOutput)  # 得到结果
#
# 打印结果
print("Card ID #: {}".format("".join(output)))
cv2.imshow("Image", imgg)
cv2.waitKey(0)
cv2.destroyAllWindows()
            运行结果:

二、总结

1、关于图像识别

        图像识别是计算机视觉领域中的一个重要任务,其目标是让计算机能够理解和解释图像中的内容以及进行自动化的图像分析和处理。图像识别技术可以应用于很多领域,例如人脸识别、物体检测、车牌识别等。

2、在图像识别任务中,通常包括以下几个步骤:

  1. 数据收集:收集大量的带有标注的图像数据,用于模型训练和测试。

  2. 数据预处理:对收集到的图像数据进行预处理,例如图像增强、尺寸调整、灰度化等。

  3. 特征提取:提取图像中的特征信息,常用的特征提取方法包括传统的基于手工设计特征的方法和基于深度学习的方法。

  4. 模型训练:使用标注好的图像数据和提取到的特征信息,训练图像识别模型,常用的深度学习模型包括卷积神经网络(CNN)、循环神经网络(RNN)等。

  5. 模型优化:对训练好的模型进行优化,主要包括模型参数调整、超参数调整等。

  6. 模型评估:使用测试集进行模型评估,评估指标包括准确率、召回率、精确率等。

  7. 预测和应用:使用训练好的模型进行图像识别预测,并将识别结果应用到实际场景中。

3、应用领域

        图像识别技术的应用非常广泛,例如人脸识别技术可以应用于安全领域、物体检测技术可以应用于智能交通领域等。随着深度学习等技术的发展,图像识别技术的准确性和效果也有了很大的提升。但是,图像识别任务仍然面临着一些挑战和问题,例如对于复杂的场景和模糊的图像可能会有较低的准确率,对于大规模数据的处理和模型的训练也需要较大的计算资源和时间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/53847.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UEFI学习笔记(五):EDK II PCD的概念、类型、使用

UEFI学习笔记&#xff08;五&#xff09;&#xff1a;EDK II PCD 一、基本概念目的 二、PCD类型1、FixedAtBuild2、FeatureFlag3、PatchableInModule4、Dynamic5、DynamicEx6、DynamicHii7、DynamicVpd 三、PCD的使用1、在.DEC中声明2、在.INF中引用3、在.DSC中配置4、在.c中使…

❤Node08-Express-jwt身份认证

❤Node08-Express-jwt身份认证 1、token基本概念​ Session认证的局限性​ Session 认证机制需要配合Cookie才能实现。由于 Cookie 默认不支持跨域访问&#xff0c;所以&#xff0c;当涉及到前端跨域请求后端接口的时候&#xff0c;需要做很多额外的配置&#xff0c;才能实现…

【JVM】JVM栈帧中的动态链接 与 Java的面向对象特性--多态

栈帧 每一次方法调用都会有一个对应的栈帧被压入栈&#xff08;虚拟机栈&#xff09;中&#xff0c;每一个方法调用结束后&#xff0c;都会有一个栈帧被弹出。 每个栈帧中包括&#xff1a;局部变量表、操作数栈、动态链接、方法返回地址。 JavaGuide&#xff1a;Java内存区域…

PostgreSQL的操作系统兼容性

PostgreSQL的操作系统兼容性 PostgreSQL 能运行在多种操作系统上&#xff0c;以下是一些主要支持的操作系统&#xff1a; Unix/Linux 系统 Linux&#xff1a;几乎所有的主流 Linux 发行版&#xff08;如 Debian、Ubuntu、Red Hat、CentOS、SuSE 等&#xff09;都支持 Postgr…

Debian项目实战——环境搭建篇

Debian系统安装 准备工作 1、系统镜像&#xff1a;根据自己的需要选择合适的版本格式&#xff1a;x86 / arm 架构 | 最好下载离线安装版本 | 清华镜像源 2、制作工具&#xff1a;balenaEtcher 3、系统媒介&#xff1a;16G以上U盘最佳 烧录镜像 打开balenaEtcher进行烧录&am…

11. 建立你的第一个Web3项目

11. 建立你的第一个Web3项目 在这一部分&#xff0c;我们将带你一步步地建立一个简单的Web3项目&#xff0c;从环境搭建到智能合约的创建与部署&#xff0c;再到开发一个去中心化应用&#xff08;dApp&#xff09;并与智能合约交互。这是你迈向Web3开发的第一步。 1. 环境搭建…

1.简述语言建模LM、统计语言建模SLM、神经语言模型NLM、预训练语言模型PLM、大语言模型LLM

语言是人类表达和交流的突出能力&#xff0c;它在儿童早期发展并在一生中不断演变。然而&#xff0c;机器除非配备了强大的人工智能算法&#xff0c;否则不能自然地掌握以人类语言形式理解和交流的能力。实现让机器像人类一样阅读、写作和交流的目标&#xff0c;一直是一个长期…

改变事件

窗口的某些属性的状态发生改变时就会触发该事件 对应的事件类型包括 QEvent::ToolBarChange, QEvent::ActivationChange, QEvent::EnabledChange, QEvent::FontChange,QEvent::StyleChange, QEvent::PaletteChange, QEvent::WindowTitleChange, QEvent::IconTextChange, QEve…

GO Govaluate

govaluate 是一个用于在 Go 语言中动态求值表达式的库。它允许你解析和评估字符串形式的表达式&#xff0c;这些表达式可以包含变量、函数以及逻辑、算术和比较操作。它非常适合在运行时处理复杂的逻辑规则和条件表达式&#xff0c;而不需要重新编译代码。 安装 govaluate go…

SpringMVC中使用REST风格

了解REST REST&#xff1a;即 Representational State Transfer。&#xff08;资源&#xff09;表现层状态转化。是目前最流行的一种互联网软件架构。使用这种架构的应用即为RESTFUL。它结构清晰、符合标准、易于理解、扩展方便&#xff0c; 所以正得到越来越多网站的采用。 …

【练习9】大数加法

链接&#xff1a;大数加法__牛客网 (nowcoder.com) 分析&#xff1a; 当作竖式计算 import java.util.*;public class Solution {public String solve (String s, String t) {StringBuffer ret new StringBuffer();//i是字符串s的最后一个字符的索引int i s.length() - 1;//j…

新能源汽车安全问题如何解决?细看“保护罩”连接器的守护使命

「当前市场上绝大部分电池的安全系数远远不够」。 在一场世界动力电池大会上&#xff0c;宁德时代的董事长曾毓群这样犀利直言。 从汽车开始向电动化转型升级那天起&#xff0c;动力电池的安全隐患就一直是个老生常谈的话题了。曾毓群的这句话&#xff0c;直接点明了行业的发展…

参数传了报错没传参数识别不到参数传丢

【记一次参数传值了但报错未传值的问题解决历程】 问题描述&#xff1a;同一个接口&#xff0c;用测试类调可以成功&#xff0c;用postman调用一直报错少参数&#xff0c;后又尝试了用idea自带的http调用&#xff0c;同样报错参数未传值。 如图&#xff0c;传值了报错未传值。…

Java并发:互斥锁,读写锁,Condition,StampedLock

3&#xff0c;Lock与Condition 3.1&#xff0c;互斥锁 3.1.1&#xff0c;可重入锁 锁的可重入性&#xff08;Reentrant Locking&#xff09;是指在同一个线程中&#xff0c;已经获取锁的线程可以再次获取该锁而不会导致死锁。这种特性允许线程在持有锁的情况下&#xff0c;可…

AI网盘搜索 1.2.6 智能文件搜索助手,一键搜索所有资源

对于经常需要处理大量文件的人来说&#xff0c;AI网盘检索简直是救星。它提供了智能对话式搜索功能&#xff0c;只需用自然语言描述就能找到需要的文件。此外&#xff0c;它还广泛支持各种文件类型&#xff0c;从文档到图片&#xff0c;全面覆盖。精准定位功能让您能够快速找到…

DSC+主备+异步备库搭建

DSC主备异步备库搭建 本次在DSC的基础上进行主备集群异步备库的搭建&#xff0c;实现DSC主备异步备库的集合。 这里DMDSC集群是看做一个数据库服务&#xff08;即DSC集群内的都叫主库&#xff09;&#xff0c;备库是一个单机实例 环境配置 服务器配置 端口配置 实例名PORT…

C#获取计算机信息

目录 效果 项目 代码 下载 效果 项目 代码 using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Windows.Forms; using System.Management; n…

Vulnhub:bassamCTF

靶机下载地址 信息收集 主机发现 扫描攻击机同网段存活主机。 nmap 192.168.31.0/24 -Pn -T4 靶机ip&#xff1a;192.168.31.165 端口扫描 nmap 192.168.31.165 -A -p- -T4 开放端口22&#xff0c;80。 网站信息收集 访问80端口的http服务。首页是空白页面&#xff0c;…

关于打不开SOAMANAGER如何解决

参考文章&#xff1a;https://blog.csdn.net/yannickdann/article/details/115396035 打开SE93

15_分布式数据结构

菜鸟&#xff1a; 老鸟&#xff0c;我最近在处理大量数据的时候遇到了瓶颈&#xff0c;单台服务器的内存和计算能力都不够用了。你知道有什么方法可以解决这个问题吗&#xff1f; 老鸟&#xff1a; 嗯&#xff0c;这种情况很常见。你可以考虑使用分布式数据结构。听说过吗&a…