【机器学习】卷积神经网络(五)-计算机视觉应用

七、应用-计算机视觉

7.1 人脸检测

DenseBox\Femaleness-Net\MT-CNN\Cascade CNN 介绍

09d80934883241c4303e322fcc08c146.png

7d8b5e305f2b67ef827b5226787d2602.png

VJ框架的分类器级联用于卷积网络

8d8118f9e262ccbbb34a7b1cc8d08b71.png

用于人脸检测的紧凑卷积神经网络级联

问题:作者希望实时检测高分辨率视频流中的正面,由于人脸图像和背景的多样性和复杂性,这具有挑战性。

解决方案:作者提出了三个卷积神经网络 (CNN) 的级联,其参数很少,并且可以在移动 GPU 上高效运行。

结果:作者表明,他们的 CNN 级联可以以高达每秒 27 帧的速度处理 4K 超高清视频,并在 FDDB 数据集上实现与最先进的正面人脸检测器相当的性能。他们还声称他们的检测器比任何现有的 CPU 或 GPU 算法都要快得多2。

本文提出了一种基于三个紧凑 CNN 级联的正面人脸检测新解决方案34。第 1 部分的要点是:

动机:作者的目标是设计一种快速、准确的检测器,可以处理高分辨率视频流,并应对人脸图像和背景的巨大变化和困难。

方法:作者使用三个参数很少的 CNN,并针对低级并行性和速度对其进行了优化。第一个 CNN 扫描图像金字塔并拒绝大部分背景区域5。第二个和第三个 CNN 使用选择单元对剩余区域进行分类和细化。最终的检测是通过非极大值抑制算法获得的。

评估:作者将他们的检测器与 FDDB 数据集上的其他正面和多视角人脸检测器进行了比较,结果表明他们的检测器具有相似的性能,但速度要高得多。他们还展示了他们的探测器可以在移动 GPU 上实时处理 4K 超高清视频,并且对图像内容具有鲁棒性。

这篇论文提出了一种基于卷积神经网络(CNN)的级联人脸检测器,它具有以下几个特点:

  • 它只有三个级联阶段,比其他的级联方法更简洁。

  • 它使用了紧凑的CNN结构,减少了特征图的数量,但保证了模型的准确性。

  • 它可以异步地执行不同的级联阶段,提高了检测的速度和效率。

  • 它利用了SIMD、CUDA和OpenCL等技术,对CNN的实现进行了优化,使得检测器的性能接近硬件的峰值。

这篇论文在两个公开的人脸检测数据集上进行了实验,证明了它的优越性。它可以在移动平台上实时地处理4K超高清视频流。

5ccd91bf8320c7c86174cd05ee94fba2.png

Compact Convolutional Neural Network Cascade for Face Detection

https://arxiv.org/ftp/arxiv/papers/1508/1508.01292.pdf  Compact Convolutional Neural Network Cascade for Face Detection

https://github.com/Bkmz21/CompactCNNCascade Bkmz21/CompactCNNCascade:一个二进制库,用于使用紧凑型 CNN 进行非常快速的人脸检测。(github.com)

51c25b0f32a32facf72ac5dbdf8e1d83.png

DenseBox目标检测

d74b7a9c2297fdae747d66a60ea800f2.png

3b614896c43f9549e8cab6aea5386e2b.png

b0bfc9485d9ac3afed28fbf0cde744f7.png

网络结构

https://zhuanlan.zhihu.com/p/44021975 人脸检测之DenseBox - 知乎 (zhihu.com)

https://arxiv.org/abs/1509.04874 

Faceness-Net 人脸检测

adcb118a362368b667ce043244010118.png

97f4f4fab1cd3a5b456175bf55007e00.png

b0b10fe3493c73b56d5884cf59e1a7d8.png

https://ar5iv.labs.arxiv.org/html/1701.08393?_immersive_translate_auto_translate=1 Faceness-Net: Face Detection through Deep Facial Part Responses --- [1701.08393] Faceness-Net:通过深层面部部分响应进行人脸检测 (arxiv.org)

MT-CNN(Multi-Task CNN,多任务CNN)

cedc9ca78c9a88e9b7c90e84e28a9c71.png

71c63af3b2e49a8c3695f8e91f5110a4.png

https://github.com/timesler/facenet-pytorch 预训练的 Pytorch 人脸检测 (MTCNN) 和人脸识别 (InceptionResnet) 模型

https://github.com/YYuanAnyVision/mxnet_mtcnn_face_detection  MTCNN人脸检测,下载mxnet_mtcnn_face_detection的源码

7.2 通用目标检测

12947c03d3e4bb62b862b099a8673a5c.png

deformable parts model 介绍

585ed87d99b95de0f956d20593263b53.png

 IOU概念介绍

6a93a55d9e910b4c902581d2873be38f.png

通用目标检测的R-CNN算法

dae3f964a7fbe639ceb6c83983eb1c0c.png

35830bed2736af70dfc52ea5018a98b2.png

4f3d4b987576b17333c4884ea5881081.png

8bad28653697d7c9f6ae188624a4448a.png

https://en.wikipedia.org/wiki/Region_Based_Convolutional_Neural_Networks

https://neurohive.io/en/popular-networks/r-cnn/

空间金字塔池化(Spatial Pyramid Pooling,简称SPP)网络

09951d6002d7bbcb506de5a4712e5475.png

a0c4e2dc63b3f5e075b6c9a1407aff72.png

9ac720bfea3fd84ed60c36dffd1b61dd.jpeg

https://www.mdpi.com/2079-9292/9/6/889 Evaluation of Robust Spatial Pyramid Pooling Based on Convolutional Neural Network for Traffic Sign Recognition System (mdpi.com)

SPP网络与R-CNN网络对比

6d804085a351457085f36bcf9d50acdf.png

介绍Fast R-CNN 网络

eade2c8e230f54bbcbce430e6a85d008.png

56a87f1d0314c53c55a6eb1acc1cac20.png

897c796d8eeafdc7756a87da624f4392.png

3b51c82f341e918350843e3b36406b04.png

Fast R-CNN - arXiv.org. https://arxiv.org/abs/1504.08083.

https://github.com/rbgirshick/fast-rcnn

详述R-CNN,SPP,Fast R-CNN的优缺点

ff0f936ce10735bd1e143d3b49835b59.png

c9d5365a7599150b8d241542860b1478.png

e53c19039e8b13b5af3bb78a7d567778.png

ROI池化层

e825a4e4dbe5b6197a2e742ca0b052e5.png

2f84c7bc3c68492b1ce2cc83a666b068.png

Faster R-CNN

819f2e756343f2a287511970f2647607.png

f881fc9322d7eadf8cf6d6e9a9955041.png

https://zhuanlan.zhihu.com/p/370407951 一文详解R-CNN、Fast R-CNN、Faster R-CNN - 知乎 (zhihu.com)

Faster R-CNN相比于之前的R-CNN版本有哪些优点和不足?

fc29ae47ef48aa794de8a8c65dcb40ac.png

Mask R-CNN

2ae1394d1e960b3dff0fa3f5290fb714.png

9dc74db9f491df72a5b7e01cdbae5fc1.png

https://arxiv.org/abs/1703.06870 [1703.06870] Mask R-CNN (arxiv.org)

https://zhuanlan.zhihu.com/p/462521226 Mask R-CNN超详细介绍 - 知乎 (zhihu.com)

Yolo 网络

4807571c31f2dcfe886957a4b860b377.png

aaa2a07ef8f0a56bd90b5c48f8ae8d77.png

e9d0e30ce240e0eb00b5f3b9c9645b32.png

https://github.com/ultralytics/yolov5

https://zhuanlan.zhihu.com/p/186014243

YOLO相较于R-CNN系列算法有哪些不同之处?

814fb45f85630bd63e040f10772e810e.png

SSD网络

0b2b557ce194dc8839153e9787103d5a.png

SSD网络结构

4e1ff76907a47ba65ab8099ad5f9ec9e.png

d202c4f6adfa924fe4ae6d772743faf6.png

SSD网络主要用于哪些任务?

fb40269c9fd008bdda0f51d2d326017a.png

SSD网络是如何生成候选检测框的?

892bf75265dbb82e2c3293c4a427d119.png

SSD网络的训练算法

6bd5da1792e041178b15808fcff0fd4e.png

https://arxiv.org/abs/1512.02325

https://arxiv.org/pdf/1512.02325.pdf

Smooth L1损失

0846ea78be31c16250287ae40c9a9b55.png

88accce43907e0dc6092b3b99989f4b2.png

https://zhuanlan.zhihu.com/p/267688490 目标检测回归损失函数——L1、L2、smooth L1 - 知乎 (zhihu.com)

7.3 人脸关键点定位

c0f8bd9d9c836c976fdf18678c0d3370.png

a5dfe42bebc9386416826999ee0ef118.png

参考网址:

https://aravamu2-cs-766-project-webpage.netlify.app/r-cnn/

https://zhuanlan.zhihu.com/p/172121380

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/605543.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【MIdjourney】图像角度关键词

本篇仅是我个人在使用过程中的一些经验之谈,不代表一定是对的,如有任何问题欢迎在评论区指正,如有补充也欢迎在评论区留言。 1.侧面视角(from side) 侧面视角观察或拍摄的主体通常以其侧面的特征为主要焦点,以便更好地展示其轮廓…

02. Eureka、Nacos注册中心及负载均衡原理

01小节中订单服务远程调用用户服务案例实现了跨服务请求,在微服务中一个服务可能是集群部署的,也就是一个服务有多个实例,但是我们在调用服务时需要指定具体的服务实例才能调用该服务,在集群模式下,服务地址应该写哪个…

1.3号io网络

文件IO 1.文件IO是基于系统调用 2.程序每进行一次系统调用,就会从用户空间向内核空间进行一次切换,执行效率较慢 3.目的:由于后期进程间通信,如管道、套接字通信,都使用的是文件IO,所以引入文件IO操作的…

MATLAB根据数据拟合曲线

MATLAB根据数据拟合曲线 MATLAB根据数据拟合曲线视频观看 MATLAB根据数据拟合曲线 x1[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,6…

C语言之详解数组【附三子棋和扫雷游戏实战】

文章目录 一、一维数组的创建和初始化1、数组的创建2、数组的初始化3、一维数组的使用4、 一维数组在内存中的存储 二、二维数组的创建和初始化1、二维数组的创建2、二维数组的初始化3、二维数组的使用4、二维数组在内存中的存储 三、数组越界边界值考虑不当导致越界访问数组大…

Mysql数据库的基础操作

1、数据库的数据类型和结构设置,修改等 DML:针对数据的增删改 where条件更像是这一条命令中的限制条件,如果不带where条件的时候,相当于针对全表所有字段进行操作 DQL; 数据查询语言 1、查询关键词使用 select 这个里…

MYSQL学习之buffer pool的理论学习

MYSQL学习之buffer pool的理论学习 by 小乌龟 文章目录 MYSQL学习之buffer pool的理论学习前言一、buffer pool是什么?二、buffer pool 的内存结构三、buffer pool 的初始化和配置初始化配置 四、buffer pool 空间管理LRU淘汰法冷热数据分离的LRU算法1.引入库2.读入…

MacBook Pro M1搭建Kafka2.7版本源码运行环境

原创/朱季谦 最近在阅读Kafka的源码,想可以在阅读过程当中,在代码写一些注释,便决定将源码部署到本地运行。 日常开发过程中,用得比较多一个版本是Kafka2.7版本,故而在MacBook Pro笔记本上用这个版本的源码进行搭建&…

计算机网络实验(二):Wireshark网络协议分析

一、实验名称:Wireshark网络协议分析 二、实验原理 HTTP协议分析 1.超文本传输协议(Hypertext Transfer Protocol, HTTP)是万维网(World Wide Web)的传输机制,允许浏览器通过连接Web服务器浏览网页。目…

高性能、可扩展、支持二次开发的企业电子招标采购系统源码

在数字化时代,企业需要借助先进的数字化技术来提高工程管理效率和质量。招投标管理系统作为企业内部业务项目管理的重要应用平台,涵盖了门户管理、立项管理、采购项目管理、采购公告管理、考核管理、报表管理、评审管理、企业管理、采购管理和系统管理等…

2023我的编程之旅、2024新的启程

目录 一、2023年结束、2024年开始 1、回顾2023年 1.1、发表文章概述 1.2、开发中遇到的问题与解决方案 2、展望2024年 2.1、新年Flag 2.2、收获与成长 一、2023年结束、2024年开始 光阴荏苒,从我开始在CSDN写作已经2年零5个月了,我也在不断的思考…

关于使用统一服务器,vscode和网页版jupyter notebook的交互问题

autodl 查看虚拟环境 在antodl上租借了一个服务器,通过在网页上运行jupyter notebook和在vscode中运行,发现环境都默认的是miniconda3。 conda info --envs 当然环境中所有的包都是一样的。 要查看当前虚拟环境中安装的所有包,可以使用以…

在CentOS 7.6上配置HTTP隧道代理

是一个相对复杂的过程,涉及到多个步骤。以下是一个详细的步骤指南,供您参考: 1. 安装必要的软件包 首先,您需要安装一些必要的软件包。打开终端,并执行以下命令: bash复制代码 sudo yum install -y epel…

Linux内核--网络协议栈(一)Socket通信原理和实例讲解

目录 一、引言 二、Socket ------>2.1、socket编程 ------>2.2、Socket的创建 三、收发数据 四、断开连接 五、删除套接字 六、网络 IO 一、引言 本章开始进入linux内核中网络部分的学习,先简单介绍一下socket套接字 二、Socket 一个数据包经由应用程序产生…

2024年如何借用电商新零售破局?新型商业模式——乐享甄选竞拍模式

2024年如何借用电商新零售破局?新型商业模式——乐享甄选竞拍模式 背景:经历疫情三年的黑天鹅,消费者对未来收入预期和不自信等悲观情绪,从而使得“勒紧腰带,少消费,不消费”,以简单实用成为了新…

DRF-源码解析-4-限流的流程:drf的限流源码,drf流量控制流程,drf如何流量控制

流量控制的逻辑: 1、设置一个唯一标识,作为cache的key 2、请求访问时,构造唯一标识,从ceche中获取[时间1,时间2,时间3,…] 3、根据设置流量控制规则,如:5/m (一分钟最多访问5次),判断该唯一标…

基于ssm的常见小儿疾病中医护理系统的设计+jsp论文

摘 要 现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本小儿疾病中医护理系统就是在这样的大环境下诞生,其可以帮助管理者在短时间内处理完毕庞大的数据…

湖南大学-计算机网路-2023期末考试【部分原题回忆】

前言 计算机网络第一门考,而且没考好,回忆起来的原题不多。 这门学科学的最认真,复习的最久,考的最差。 教材使用这本书: 简答题(6*530分) MTU和MSS分别是什么,联系是什么&#x…

如何衡量一个排序算法的性能

这是八股文的知识,但是中国人又个好的习惯,当别人给你一块好吃的面包时,你总想知道这个面包是怎么做的,对于目前的IT行业来说,不管这个做法你是被动的学习还是主动的探索,你都要知道,也必须要知…

如何解决vscode中文路径的问题

首先我们进入设备 搜索“区域”,选择“区域设置” 点击管理语言设置 点击更改系统区域设置,勾选“Beta 版: 使用 Unicode UTF-8 提供全球语言支持(U)”,电脑会叫你重启,你重启就行了