通过超分辨率重构来提高二维码的对比度

1 问题描述

(1)图像分辨率小。例如一些嵌入在海报(如图1)或远距离拍摄的码,其分辨率远小于通常情况下的码图像。
在这里插入图片描述
图1.海报中的二维码占比很小
(2)图像质量较低。有很多是经过了多次的压缩和转发,存在严重的人工效应(如振铃效应)干扰。
在这里插入图片描述
(3)由于光照等原因,导致二维码亮度不均匀、图像模糊等。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2 微信超分辨率重构的框架

通常情况下,相比于低分辨率图像,高分辨率图像能够提供更丰富的细节,呈现出良好的视觉效果,对于二维码识别这种以图像作为输入的后续流程,也有助于提高系统的整体表现。然而,受成像设备、存储空间和网络资源的限制,我们常常只能获得较低分辨率的图像。于是,超分辨率技术便派上了用场。
超分辨率技术以低分辨率图像作为输入,重建高分辨率输出,是计算机视觉领域的一个经典问题。传统的基于像素插值的超分算法以其计算简单、速度快的优势,被广泛采用,如最近邻(nearest)插值,双线性(bilinear)插值以及双三次(bicubic)插值等。但它们无法适应多样的图像内容,感知能力较差,难以重建出图像的高频信息,输出图像过于模糊,应用于压缩图像时,甚至会放大人工效应干扰。
近年来,计算机视觉技术和深度学习飞速发展,学术界开始关注利用深度学习解决图像重建问题。我们根据扫码图像的特点,设计了适用于移动端的超分网络,实现了快速高效的码图像重建,并改善图像质量,大大提高了扫码算法的识别成功率。网络结构如图所示。
在这里插入图片描述图1 码图像重建网络结构

3 API

基于OpenCV开发了相应的API。

3.1 cv.wechat_qrcode_WeChatQRCode

cv.wechat_qrcode_WeChatQRCode(detector_prototxt_path, detector_caffe_model_path, super_resolution_prototxt_path, super_resolution_caffe_model_path) -> <wechat_qrcode_WeChatQRCode object>

初始化微信 QR 码检测模块,包括两个基于 CNN 的模型:对象检测模型和超分辨率模型。对象检测模型用于检测带有边界框的二维码。当 QR 码较小时,采用超分辨率模型对其进行放大。

文件地址:https://github.com/WeChatCV/opencv_3rdparty

3.1.1 参数说明:

参数名参数含义
detector_prototxt_path对象检测模型的prototex文件路径
detector_caffe_model_path对象检测模型的caffe模型文件路径
super_resolution_prototxt_path超分辨率模型的prototex文件路径
super_resolution_caffe_model_path超分辨率模型的caffe模型文件路径

3.1.2 返回值:

wechat_qrcode_WeChatQRCode 对象

3.2 cv.wechat_qrcode_WeChatQRCode.detectAndDecode

cv.wechat_qrcode_WeChatQRCode.detectAndDecode(img[, points]) ->retval, points

检测和解析二维码

3.2.1 参数说明:

参数名参数含义
imgopencv 读取的灰度图或 BGR 图
points检测到 QR 码四边形顶点后,将其位置输出到该数组

3.2.2 返回值:

retval: 解析结果

points: QR 码四边形顶点位置数组,如果找不到则为空

4 二维码提升对比度测试

4.1 测试代码:

import cv2
import osif __name__ == '__main__':# 初始化对象detector = cv2.wechat_qrcode_WeChatQRCode("detect.prototxt","detect.caffemodel","sr.prototxt","sr.caffemodel")results = {"image": [], "res": [], "points": []}image_dir = "src"files = os.listdir(image_dir)# 遍历图片目录for f in files:image_file = os.path.join(image_dir, f)img = cv2.imread(image_file)  # 读取图像res, points = detector.detectAndDecode(img)  # 检测图像if res:  # 非空表示检测成功results["image"].append(image_file)results["res"].append(res)results["points"].append(points)image_num = len(files)detected_num = len(results['res'])print("Image dir:", image_dir)print(f"Processed images: {image_num} , detected images: {detected_num}",f"detection success rate : {detected_num / image_num * 100}%. ")print("Detected images are:")for i in results['image']:print(i, end=',')

4.2 输出结果

Image dir: src
Processed images: 134 , detected images: 19 detection success rate : 14.17910447761194%.

Dected images are:
src/4_217.jpg,src/4_135.jpg,src/10_144.jpg,src/4_171.jpg,src/19_146.jpg,src/4_148.jpg,src/19_164.jpg,src/6_29.jpg,src/19_171.jpg,src/4_39.jpg,src/2.jpg,src/6_41.jpg,src/19_162.jpg,src/19_154.jpg,src/19_181.jpg,src/4_228.jpg,src/4_140.jpg,src/4_26.jpg,src/4_38.jpg

Image dir: detect
Processed images: 137 , detected images: 22 detection success rate : 16.05839416058394%.

Detected images are:
detect/4_217.jpg,detect/4_171.jpg,detect/19_146.jpg,detect/4_148.jpg,detect/19_164.jpg,detect/4_196.jpg,detect/19_151.jpg,detect/4_76.jpg,detect/4_81.jpg,detect/4_39.jpg,detect/19_159.jpg,detect/2.jpg,detect/19_165.jpg,detect/6_41.jpg,detect/19_162.jpg,detect/19_154.jpg,detect/19_137.jpg,detect/5_13.jpg,detect/4_132.jpg,detect/4_228.jpg,detect/4_26.jpg,detect/4_38.jpg

5 简单分析

以未能成功检测的src/5_50.jpg为例:

该图片通过微信扫码可以成功检测,检测成功时摄像头离图片较近,因此考虑在 QR 检测程序中对图片进行缩放预处理:

x, y = img.shape[0:2]
img = cv2.resize(img, (int(y * 1.5), int(x * 1.5)))

结果如下:
Image dir: detect
Processed images: 137 , detected images: 33 detection success rate : 24.087591240875913%.
Detected images are:
detect/4_217.jpg,detect/4_135.jpg,detect/10_144.jpg,detect/4_171.jpg,detect/4_133.jpg,detect/4_69.jpg,detect/19_164.jpg,detect/19_151.jpg,detect/6_29.jpg,detect/4_76.jpg,detect/6_2.jpg,detect/7_47.jpg,detect/4_81.jpg,detect/4_39.jpg,detect/2.jpg,detect/19_165.jpg,detect/15_75.jpg,detect/7_44.jpg,detect/7_7.jpg,detect/6_12.jpg,detect/19_162.jpg,detect/11_99.jpg,detect/4_100.jpg,detect/19_154.jpg,detect/19_137.jpg,detect/5_50.jpg,detect/5_13.jpg,detect/19_181.jpg,detect/14_11.jpg,detect/4_228.jpg,detect/6_30.jpg,detect/4_26.jpg,detect/4_38.jpg

Image dir: src
Processed images: 134 , detected images: 32 detection success rate : 23.88059701492537%.
Detected images are:
src/4_217.jpg,src/4_135.jpg,src/10_144.jpg,src/4_171.jpg,src/19_146.jpg,src/4_69.jpg,src/19_164.jpg,src/4_196.jpg,src/6_29.jpg,src/4_76.jpg,src/19_171.jpg,src/6_2.jpg,src/4_220.jpg,src/7_47.jpg,src/4_81.jpg,src/7_29.jpg,src/4_39.jpg,src/19_159.jpg,src/4_237.jpg,src/2.jpg,src/19_165.jpg,src/15_75.jpg,src/4_115.jpg,src/19_162.jpg,src/19_154.jpg,src/5_50.jpg,src/5_13.jpg,src/19_181.jpg,src/4_228.jpg,src/6_30.jpg,src/4_26.jpg,src/4_38.jpg

测试结果表明 opencv 中的 QR 码识别 API 主要针对理想位置和大小的 QR 码图像进行识别,而简单的图像预处理可以提高 QR 码识别成功率。

6 总结及展望

我们目前通过调用微信API来实现检测和超分辨率重构,下一步工作将搭建图1所示的网络,利用微信已经训练好的模型,来看看通过超分辨率重构后的效果。

参考文献

https://blog.csdn.net/qq_35054151/article/details/113647111

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507659.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android web 访问数据库,Web下的JDBC访问数据库的基本步骤

Web下的JDBC访问数据库的基本步骤(2012-06-02 12:09:33)在Java程序中连接数据库的一般步骤分为一下几部分&#xff0c;我摘录出来&#xff0c;跟大家分享。(1)将数据库的JABC驱动加载到classpath中&#xff0c;在基于JavaEE的Web应用开发过程中&#xff0c;通常把JDBC驱动放在W…

linux 磁盘扩容_记录一次ESXi Linux在线扩容,不重启系统

因为工作需要&#xff0c;需要将运行在ESXi主机上面的一台Centos 里面的一个LV卷进行扩容&#xff0c;下面记录了此次扩展的详细过程&#xff0c;整个过程&#xff0c;不需要重启服务器。1. 首先通过df-h 查看当前磁盘结构如下&#xff1a;我们此次的最终目标&#xff0c;就是将…

我目前的主要研究方向

推荐系统 https://blog.csdn.net/search_129_hr/article/details/118680185 游戏难度动态调整 https://blog.csdn.net/search_129_hr/article/details/119204173 睡眠声音识别与增强 https://blog.csdn.net/search_129_hr/article/details/118568452 二维码图像识别与增强…

linux的任务计划6,Linux计划任务

Linux计划任务&#xff1a;未来的某个时间执行一次任务&#xff0c;或者周期性执行某个任务&#xff0c;执行结果会通过邮件通知定时任务&#xff1a;at batch周期性任务&#xff1a;crontab系统任务调度&#xff1a;/ect/crontab用户任务调度&#xff1a;/var/spool/cronmail​…

aws python lambda_python – AWS Lambda发送HTTP请求

这可能是一个简单回答的问题,但我似乎无法弄明白.背景&#xff1a;我有一个python Lambda函数来获取数据库中的更改,然后使用HTTP将json中的更改发布到URL.我正在使用urllib2这样&#xff1a;# this runs inside a loop, in reality my error handling is much betterrequest …

标签分布学习相关研究

1 标记增强及标签分布学习 https://mp.weixin.qq.com/s/cXiR-UeJkcdkljJvE2eERw http://palm.seu.edu.cn/xgeng/files/sc-info18.pdf https://baijiahao.baidu.com/s?id1687693358774525583&wfrspider&forpc https://blog.csdn.net/weixin_42001089/article/details/…

android item三种,Android RecyclerView中的ItemDecoration的几种绘制方法

如题&#xff0c;我们使用recyclerview的时候&#xff0c;如果没有设置显示条目的margin&#xff0c;或者padding的话&#xff0c;是没有分割线效果的。那么除去使用margin或padding,其余的方法是用itemdecoration绘制分割线我们绘制分割线的时候通常会使用drawable去绘制&…

上传文件和提交textfield_0基础掌握Django框架(37)文件上传

为了更好的学习效果&#xff0c;请搭配视频教程一起学习&#xff1a;Django零基础到项目实战 - 网易云课堂​study.163.com文件上传&#xff1a;文件上传是网站开发中非常常见的功能。这里详细讲述如何在Django中实现文件的上传功能。前端HTML代码实现&#xff1a;在前端中&…

2021年第3周LDL方向的周报

LDL小组&#xff1a; 如何快速进入研究状态 &#xff08;1&#xff09;系列性的工作&#xff0c;papermaker&#xff1a;读文献&#xff0c;顶刊顶会&#xff0c;综述性文章–》进行扩展&#xff0c;研究主线 &#xff08;2&#xff09;接手师兄师姐的工作–》并且对已有的工作…

2021年第3周人工智能方向的周报

快速进入研究&#xff1a; &#xff08;1&#xff09;读文献–》综述性的文献–》你自己去综述性文献 &#xff08;2&#xff09;已有的工作 &#xff08;3&#xff09;有没有相关的数据&#xff1f; 下一步事情&#xff1a; &#xff08;1&#xff09;想一想自己的横向做什么…

华为p10刷原生android,华为p10怎么刷机 华为p10刷机方法【详细介绍】

喜欢折腾手机的用户一定对于手机root权限获取不陌生&#xff0c;root后虽然不能享受官方联保服务但同时带来的好处不用小编多说。前面给大家介绍了 华为p10 刷入第三方recovery教程&#xff0c;现在华为p10刷机包已经放出来&#xff0c;小编给大家带来华为p10刷机权限获取教程。…

pythoncookie自动模拟登录_用Python模拟技巧带你实现自动抽屉登录自动点赞

原标题&#xff1a;用Python模拟技巧带你实现自动抽屉登录&自动点赞/1 前言/嘿&#xff0c;各位小伙伴们晚上好呀&#xff0c;今天小编又给大家带来干货内容啦,今天带来的是,如何自动登录抽屉&#xff0c;并且点赞&#xff01;原计划是不打算使用selenium的&#xff0c;但是…

同学之间互相出的一些有趣题目

题目1&#xff1a;过隧道时间最短问题 四个人&#xff08;A、B、C、D&#xff09;晚上过隧道,并且只有一个手电筒,每次只能过两个人,并且还需要有一个人回来传递手电筒,四个人过隧道的速度不一样,分别是1、2、5、10分钟,问怎么过隧道最快?总共用多长时间? 问题扩展&#xf…

android studio sqlitedatabase,在SQLite数据库Android Studio上使用预填充数据库

本问题已经有最佳答案&#xff0c;请猛点这里访问。在这里&#xff0c;我想使用我预先填充的SQLite数据库到我的Android应用程序。 因此&#xff0c;首次运行时&#xff0c;它会自动从assets文件夹中复制数据库&#xff0c;并在我的Android应用程序中将其用作数据库。到目前为止…

使用container的嵌套_ElementUI 技术揭秘(4)— Container 布局容器组件的设计与实现。...

前言上一篇文章我们分析了 Layout 布局组件的设计和实现&#xff0c;它的应用场景通常是局部布局。对于整个页面的布局&#xff0c;element-ui 提供了 Container 布局容器组件&#xff0c;专门用于 PC 管理后台页面的整体布局。需求分析我们先通过几幅图看一下页面的常见布局。…

推荐系统最新研究进展

算法相关的综述 从200多篇顶会论文看推荐系统前沿方向与最新进展 基于强化学习的推荐系统相关研究进展、经典论文整理分享 推荐系统去偏&#xff08;Debiased Recommendation&#xff09;研究进展概述 Deep Learning Based Recommender System: A Survey and New Perspectives…

html自动生成在线试题,HTML5测试题整理Ⅰ

1.在 HTML5 中&#xff0c;哪个元素用于组合标题元素&#xff1f;答案&#xff1a;2.HTML5 中不再支持哪个元素&#xff1f;答案&#xff1a;&#xff0c;,,,,,,,,,,3.在 HTML5 中&#xff0c;onblur 和 onfocus 是?答案&#xff1a;事件属性4.在 HTML5 中&#xff0c;新多媒体…

2021年第3周推荐系统方向的周报

1、如何快速进入研究状态 &#xff08;1&#xff09;研究方向对应的研究内容 综述性文献 &#xff08;2&#xff09;熟悉写文章的规范 表达能力、创新、编码、写作的规范&#xff08;Latex、如何写标题、如何写摘要、如何画图。。。。&#xff09;&#xff0c;最好是接手师兄师…

python唯一映射类型_Python基础:04映射类型

字典是Python语言中唯一的映射类型。一个字典对象是可变的&#xff0c;它是一个容器类型&#xff0c;能存储任意个数的Python对象。字典中的数据是无序排列的。映射类型也可被称做哈希表&#xff0c;哈希表的算法是获取键&#xff0c;对键执行一个叫做哈希函数的操作&#xff0…

宝马屏幕共享android,宝马屏幕共享功能怎么用

【太平洋汽车网】使用宝马屏幕共享要先打开车载电脑多媒体功能&#xff0c;再选择屏幕共享手机投屏&#xff0c;勾掉宝马互联选项&#xff0c;然后再打开手机wifi&#xff0c;选择BMW输入密码即可使用屏幕共享。车手机互联映射即车机互联&#xff0c;就是将手机投屏到车载显示器…