OpenCV+Python识别机读卡

背景介绍

正常机读卡是通过读卡机读取识别结果的,目前OpenCV已经这么强大了,尝试着用OpenCV+Python来识别机读卡。要识别的机读卡长这样:

我们做以下操作:

1.识别答题卡中每题选中项结果。

不做以下操作:

1.不识别准考证号。(暂不识别,后面有需要再补充此部分)

2.不识别101-106题(这些题实际情况下经常用不到,如果要识别原理也一样)

实现思路

通过分析答题卡特征:

1.答题区域为整张图片最大轮廓,先找出答题区域。

2.答题区域分为6行,每行4组,第6行只有1组,我们暂不处理第6行,只处理前面5行。

3.给定每一行第一个选项中心点坐标,该行其余选项的中心点坐标可以推算出来。

4.通过找到每个选项中心点坐标,再加上选项宽高,就可以在答题区域绘出每个选项的范围。

5.通过计算每个选项范围图像里非0像素点个数:

   单选题非0像素点最少的既是答案。

   多选题结合阈值判断该选项是否选中。

6.输出完整答案。

实现步骤

1.图像预处理

将图片转灰度图、黑帽运算:移除干扰项、二值化突出轮廓、查找轮廓、找出答题区域。

import cv2
import numpy as np# 1.读取图片并缩放
orginImg = cv2.imread("1.jpg")
size = ((int)(650*1.8), (int)(930*1.8))  # 尽可能将图片弄大一点,下面好处理
img = cv2.resize(orginImg, size)#显示图像
def imshow(name,image):scale_percent = 50  # 缩放比例width = int(image.shape[1] * scale_percent / 100)height = int(image.shape[0] * scale_percent / 100)dim = (width, height)resized_image = cv2.resize(image, dim, interpolation=cv2.INTER_AREA)cv2.imshow(name, resized_image)imshow("1.orgin", img)# 2.转灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
imshow("2.gray", gray)# 3.黑帽运算:移除干扰项
cvblackhat = cv2.morphologyEx(gray, cv2.MORPH_BLACKHAT, cv2.getStructuringElement(cv2.MORPH_RECT, (15, 15)))
imshow("3.black", cvblackhat)# 4.二值化突出轮廓,自动阈值范围 cv2.THRESH_BINARY|cv2.THRESH_OTSU
thresh = cv2.threshold(cvblackhat, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
imshow("4.thresh", thresh)# 5.提取轮廓,并在图上标记轮廓
cnts, hierarchy = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
mark = img.copy()
cv2.drawContours(mark, cnts, -1, (0, 0, 255), 2)
imshow("5.contours", mark)# 6.提取我们感兴趣的部分(这里我们只需要答题部分) img[y:y+h, x:x+w]
roi = None
for (i, c) in enumerate(cnts):(x, y, w, h) = cv2.boundingRect(c)ar = w/float(h)if w > 500 and h > 500 and ar > 0.9 and ar < 1.1:roi = img[y:y+h, x:x+w]break
imshow("5.roi", roi)

运行结果

2.查找每个选项的中心点坐标

这里每行起始点坐标和每个选项宽高,都是写的固定值(手动量出来的,本来想通过图像提取轮廓来取每个选项中心坐标点的,可是由于机读卡填图不规范,可能会影响轮廓提取,不是很靠谱,暂时没想到更好的办法)


# 7.查找每个选项的中心点坐标
# 思路:
# 通过分析:
# 1.答题区域分为6行,每行4组,第6行只有1组,我们暂不处理第6行,只处理前面5行。
# 2.只要给定每一行第一个选项中心坐标,该行其余选项的中心坐标可以推算出来。
# 3.通过找到每个选项中心点坐标,再加上选项宽高,就可以在答题区域绘出每个选项的范围。
# 4.通过计算每个选项范围图像里非0像素点个数,结合阈值判断该选项是否选中。
# 5.结合题目个数,遍历每个选项,构造出最终答案。
item = [34, 20]  # 每个选项宽度(跟图形缩放有关系)
x_step = 44  # x方向行距(两个选项水平方向距离)
y_step = 28  # y方向行距(两个选项垂直方向距离)
blank = 92  # 每组间距(5个一组)水平方向距离
centers = []  # 每个选项的中心点坐标,用来框选选项
# 答题区域有5行多1组,这里只处理前面5行,最后一组暂不处理
startPonits = [(25, 44), (25, 216), (26, 392), (26, 566), (28, 744)]
for (i, p) in enumerate(startPonits):temp = []  # 暂存该组选项坐标start = list(p)  # 该行起始点坐标for g in range(0, 4, 1):  # 每行有4组if len(temp) > 0:startx = temp[len(temp)-1][0] + blank  # 最后一个选项的x坐标+每组间距else:startx = start[0]start[0] = startxfor i in range(start[0], start[0]+5*x_step, x_step):  # 水平5个选项for j in range(start[1], start[1]+4*y_step, y_step):  # 垂直4个选项temp.append((i, j))for (i, c) in enumerate(temp):centers.append(c)# 8.将选项绘制到答题区域
show = roi.copy()
for (i, (x, y)) in enumerate(centers):left = x-(int)(item[0]/2)top = y-(int)(item[1]/2)# 绘选项区域矩形cv2.rectangle(show, (left, top), (left +item[0], top + item[1]), (0, 0, 255), -1)# 绘制序号标签cv2.putText(show, str(i+1), (left, top+10),cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
imshow("5.show", show)

运行结果

3.遍历每个选项,计算非0像素点个数

# 9.截取每个答题选项,并计算非0像素点个数
map = roi.copy()
map = cv2.cvtColor(map, cv2.COLOR_BGR2GRAY)
map = cv2.threshold(map, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
points = []
for (i, (x, y)) in enumerate(centers):left = x-(int)(item[0]/2)top = y-(int)(item[1]/2)# 截取每个选项小图item_img = map[top:top+item[1], left:left+item[0]]count = cv2.countNonZero(item_img)points.append(count)cv2.imwrite("item/"+str(i+1)+"-"+str(count)+".jpg", item_img)

这里为了方便观看,将每个选项截取另存为成图像了,以索“引号+非0像素点个数”命名。实际过程中可以不另存为图像。

大概像这样:

4.整理答案

# 10.整理答案
answer = []  # 二维数组:保存每个题ABCD4个选项值
group = []  # 将点分组,每4个1组,对应每题的4个选项
for i in range(0, len(points), 1):group.append(points[i])if (i+1) % 4 == 0:answer.append(group)group = []def printItem(i, optoins):question = {0: "A", 1: "B", 2: "C", 3: "D"}index = 0if i < 80:# 单选题(非0像素点最少的既是答案)an = min(optoins)index = optoins.index(an)print("第"+str(i+1)+"题"+question.get(index))else:# 多选题(根据阈值来判断是否选中)ans = ""for (j, p) in enumerate(options):if p < 400:index = optoins.index(p)ans += question.get(index)print("第"+str(i+1)+"题"+ans)# 打印题目答案
for (i, options) in enumerate(answer):printItem(i, options)

输出结果:

完整代码

import cv2
import numpy as np# 1.读取图片并缩放
orginImg = cv2.imread("1.jpg")
size = ((int)(650*1.8), (int)(930*1.8))  # 尽可能将图片弄大一点,下面好处理
img = cv2.resize(orginImg, size)# 显示图像
def imshow(name, image):scale_percent = 50  # 缩放比例width = int(image.shape[1] * scale_percent / 100)height = int(image.shape[0] * scale_percent / 100)dim = (width, height)resized_image = cv2.resize(image, dim, interpolation=cv2.INTER_AREA)cv2.imshow(name, resized_image)imshow("1.orgin", img)# 2.转灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
imshow("2.gray", gray)# 3.黑帽运算:移除干扰项
cvblackhat = cv2.morphologyEx(gray, cv2.MORPH_BLACKHAT, cv2.getStructuringElement(cv2.MORPH_RECT, (15, 15)))
imshow("3.black", cvblackhat)# 4.二值化突出轮廓,自动阈值范围 cv2.THRESH_BINARY|cv2.THRESH_OTSU
thresh = cv2.threshold(cvblackhat, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
imshow("4.thresh", thresh)# 5.提取轮廓,并在图上标记轮廓
cnts, hierarchy = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
mark = img.copy()
cv2.drawContours(mark, cnts, -1, (0, 0, 255), 2)
imshow("5.contours", mark)# 6.提取我们感兴趣的部分(这里我们只需要答题部分) img[y:y+h, x:x+w]
roi = None
for (i, c) in enumerate(cnts):(x, y, w, h) = cv2.boundingRect(c)ar = w/float(h)if w > 500 and h > 500 and ar > 0.9 and ar < 1.1:roi = img[y:y+h, x:x+w]break
imshow("5.roi", roi)# 7.查找每个选项的中心点坐标
# 思路:
# 通过分析:
# 1.答题区域分为6行,每行4组,第6行只有1组,我们暂不处理第6行,只处理前面5行。
# 2.只要给定每一行第一个选项中心坐标,该行其余选项的中心坐标可以推算出来。
# 3.通过找到每个选项中心点坐标,再加上选项宽高,就可以在答题区域绘出每个选项的范围。
# 4.通过计算每个选项范围图像里非0像素点个数,结合阈值判断该选项是否选中。
# 5.结合题目个数,遍历每个选项,构造出最终答案。
item = [34, 20]  # 每个选项宽度(跟图形缩放有关系)
x_step = 44  # x方向行距(两个选项水平方向距离)
y_step = 28  # y方向行距(两个选项垂直方向距离)
blank = 92  # 每组间距(5个一组)水平方向距离
centers = []  # 每个选项的中心点坐标,用来框选选项
# 答题区域有5行多1组,这里只处理前面5行,最后一组暂不处理
startPonits = [(25, 44), (25, 216), (26, 392), (26, 566), (28, 744)]
for (i, p) in enumerate(startPonits):temp = []  # 暂存该组选项坐标start = list(p)  # 该行起始点坐标for g in range(0, 4, 1):  # 每行有4组if len(temp) > 0:startx = temp[len(temp)-1][0] + blank  # 最后一个选项的x坐标+每组间距else:startx = start[0]start[0] = startxfor i in range(start[0], start[0]+5*x_step, x_step):  # 水平5个选项for j in range(start[1], start[1]+4*y_step, y_step):  # 垂直4个选项temp.append((i, j))for (i, c) in enumerate(temp):centers.append(c)# 8.将选项绘制到答题区域
show = roi.copy()
for (i, (x, y)) in enumerate(centers):left = x-(int)(item[0]/2)top = y-(int)(item[1]/2)# 绘选项区域矩形cv2.rectangle(show, (left, top), (left +item[0], top + item[1]), (0, 0, 255), -1)# 绘制序号标签cv2.putText(show, str(i+1), (left, top+10),cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
cv2.imshow("5.show", show)# 9.截取每个答题选项,并计算非0像素点个数
map = roi.copy()
map = cv2.cvtColor(map, cv2.COLOR_BGR2GRAY)
map = cv2.threshold(map, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
points = []
for (i, (x, y)) in enumerate(centers):left = x-(int)(item[0]/2)top = y-(int)(item[1]/2)# 截取每个选项小图item_img = map[top:top+item[1], left:left+item[0]]count = cv2.countNonZero(item_img)points.append(count)cv2.imwrite("item/"+str(i+1)+"-"+str(count)+".jpg", item_img)# 10.整理答案
answer = []  # 二维数组:保存每个题ABCD4个选项值
group = []  # 将点分组,每4个1组,对应每题的4个选项
for i in range(0, len(points), 1):group.append(points[i])if (i+1) % 4 == 0:answer.append(group)group = []def printItem(i, optoins):question = {0: "A", 1: "B", 2: "C", 3: "D"}index = 0if i < 80:# 单选题(非0像素点最少的既是答案)an = min(optoins)index = optoins.index(an)print("第"+str(i+1)+"题"+question.get(index))else:# 多选题(根据阈值来判断是否选中)ans = ""for (j, p) in enumerate(options):if p < 400:index = optoins.index(p)ans += question.get(index)print("第"+str(i+1)+"题"+ans)# 打印题目答案
for (i, options) in enumerate(answer):printItem(i, options)cv2.waitKey(0)
cv2.destroyAllWindows()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/52257.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

宝塔面板配置node/npm/yarn/pm2....相关全局变量 npm/node/XXX: command not found

1.打开终端 , cd 到根目录 cd / 2.跳转至node目录下,我的node版本是v16.14.2 cd /www/server/nodejs/v16.14.2/bin 2.1 如果不知道自己node版本多少就跳转到 cd /www/server/nodejs 然后查找当前目录下的文件 ls 确定自己的node版本 cd /node版本/bin 3.继续查看bin…

秋招突击——8/21——知识补充——计算机网络——cookie、session和token

文章目录 引言正文Cookie——客户端存储和管理Session——服务端存储和管理Token补充签名和加密的区别常见的加密算法和签名算法 面试题1、HTTP用户后续的操作&#xff0c;服务端如何知道属于同一个用户&#xff1f;如果服务端是一个集群机器怎么办&#xff1f;2、如果禁用了Co…

android13隐藏调节声音进度条下面的设置按钮

总纲 android13 rom 开发总纲说明 目录 1.前言 2.情况分析 3.代码修改 4.编译运行 5.彩蛋 1.前言 将下面的声音调节底下的三个点的设置按钮,隐藏掉。 效果如下 2.情况分析 查看布局文件 通过布局我们可以知道这个按钮就是 com.android.keyguard.AlphaOptimizedImageB…

记忆化搜索与状态压缩:优化递归与动态规划的利器

记忆化搜索是解决递归和动态规划问题的一种高效优化技术。它结合了递归的灵活性和动态规划的缓存思想&#xff0c;通过保存已经计算过的子问题结果&#xff0c;避免了重复计算&#xff0c;大幅提升了算法的效率。当问题状态复杂时&#xff0c;状态压缩技术可以进一步优化空间使…

跨域解决 | 面试常问问题

跨域解决 | 面试常问问题 跨域问题一直是前端开发中不可避免的一部分&#xff0c;它涉及到浏览器的同源策略和安全机制。本文将深入解析跨域问题的本质&#xff0c;并探讨前端和后端的多种解决方案&#xff0c;同时分享一些扩展与高级技巧。最后&#xff0c;我们还将总结跨域解…

UE基础 —— Components

目录 Component Instancing Instanced Static Mesh Component Instanced Static Mesh Differences of an ISM and a Static Mesh Component Hierarchical Instanced Static Mesh Instancing Systems Working with ISMs Prefabrication Custom Data Creating and Edit…

ElasticSearch 8.15.0 与 Kibana 8.15.0 尝鲜体验

还不算晚&#xff0c;虽然已经距离发布过去了快半个月~ 跟着下面的步骤进行一步一步操作(CV)&#xff0c;只需要改动一下用户名、密码这些数据即可从零开始用 Docker安装 ES 与 Kibana 最新版&#xff0c;据说 Kibana 还有 AI 助手嘞(虽然是 8.12 推出的)~ 最后强调一点&#…

自动化开发流程:使用 GitHub Actions 进行 CI/CD

在现代软件开发过程中&#xff0c;持续集成&#xff08;Continuous Integration, CI&#xff09;和持续部署&#xff08;Continuous Deployment, CD&#xff09;是确保高质量软件交付的关键组成部分。GitHub Actions 提供了一种简便的方式来实现 CI/CD 流程的自动化。本文将介绍…

Unity XR Interaction Toolkit 通过两个手柄控制物体放大缩小

1&#xff1a;给物体添加 XR General Grab Transformer 脚本 2&#xff1a;XR Grab Interactable 的 select mode 选择 Multiple

java-队列--黑马

队列 别看这个&#xff0c;没用&#xff0c;还是多刷力扣队列题 定义 队列是以顺序的方式维护一组数据的集合&#xff0c;在一端添加数据&#xff0c;从另一端移除数据。一般来讲&#xff0c;添加的一端称之尾&#xff0c;而移除一端称为头 。 队列接口定义 // 队列的接口定…

Linux——驱动——杂项设备

一、杂项设备驱动 1、概念 杂项设备&#xff08;Miscellaneous Devices&#xff09;在Linux内核中是一种特殊的设备类型&#xff0c;用于表示那些不适合被归类为其他标准设备类型的设备。这些设备通常具有不规则的特性和非标准的通信协议或接口。 2、操作流程 杂项设备注册过…

中国数据库的崛起:从本土化挑战到全球化机遇

引言 谈起中国的崛起&#xff0c;大家第一反应可能是“中国制造”“高铁奇迹”“电商帝国”&#xff0c;但今天我们要聊的&#xff0c;是一个比这些还要神秘的存在——中国的数据库技术。或许你平时并不会经常关注它&#xff0c;但这个隐身在你手机、电脑、服务器背后的无形力…

002、架构_概览

GoldenDB 主要由管理节点、计算节点、数据节点、全局事务节点等模块组成&#xff0c;各个节点无需共享任何资源&#xff0c;均为独立自治的通用计算机节点&#xff0c;之间通过高速互联的 网络通讯&#xff0c;从而完成对应用数据请求的快速处理和响应。 管理节点在数据库中主要…

如何在寂静中用电脑找回失踪的手机?远程控制了解一下

经过一番努力&#xff0c;我终于成功地将孩子哄睡了。夜深人静&#xff0c;好不容易有了一点自己的时间&#xff0c;就想刷手机放松放松&#xff0c;顺便看看有没有重要信息。但刚才专心哄孩子去了&#xff0c;一时就忘记哄孩子之前&#xff0c;顺手把手机放哪里去了。 但找过手…

种树问题——CSP-J1真题讲解

【题目】 小明在某一天中依次有七个空闲时间段&#xff0c;他想要选出至少一个空闲时间段来练习唱歌&#xff0c;但他希望任意两个练习的时间段之间都有至少两个空闲的时间段让他休息。则小明一共有( ) 种选择时间段的方案 A. 31 B. 18 C. 21 D. 33 【答案】 B 【解析…

Vue.js学习笔记(七)使用sortablejs或el-table-draggable拖拽ElementUI的el-table表格组件

文章目录 前言一、el-table-draggable是什么&#xff1f;二、使用步骤1.安装使用2.sortablejs 总结 前言 记录 el-table-draggable 插件使用方法。 一、el-table-draggable是什么&#xff1f; el-table-draggable的存在就是为了让vue-draggable支持element-ui中的el-table组件…

卸载nomachine

网上的方法:提示找不到命令 我的方法: step1. 终端输入 sudo find / -name nxserver 2>/dev/null确认 NoMachine 的实际安装路径。你可以使用 find 命令在系统中查找 nxserver 脚本的位置。 找到路径后,你可以使用该路径来卸载 NoMachine。 如下图,紫色框中是我的路径…

Android - lock/unlock bootloader

在执行 adb remount 时高版本经常会提示失败 此时就需要对设备的进行解锁操作。记录两个部分&#xff0c;Google解锁和展锐解锁。 目录 一、Google解锁 二、展锐解锁 三、补充跳过按键检测的方案 一、Google解锁 官网介绍的unlock方法如下&#xff1a;锁定/解锁引导加载程序…

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测-迅为电子

随着人工智能和大数据时代的到来&#xff0c;传统嵌入式处理器中的CPU和GPU逐渐无法满足日益增长的深度学习需求。为了应对这一挑战&#xff0c;在一些高端处理器中&#xff0c;NPU&#xff08;神经网络处理单元&#xff09;也被集成到了处理器里。NPU的出现不仅减轻了CPU和GPU…

Linux基础环境开发工具gcc/g++ make/Makefile git

1.Linux编译器-gcc/g使用 1. 预处理&#xff08;进行宏替换) 预处理功能主要包括宏定义,文件包含,条件编译,去注释等。 预处理指令是以#号开头的代码行。 实例: gcc –E hello.c –o hello.i 选项“-E”,该选项的作用是让 gcc 在预处理结束后停止编译过程。 选项“-o”是指目标…