【目标检测经典算法】R-CNN、Fast R-CNN和Faster R-CNN详解系列三：Faster R-CNN图文详解

【目标检测经典算法】R-CNN、Fast R-CNN和Faster R-CNN详解系列三：Faster R-CNN图文详解

news/2025/7/16 6:14:50/文章来源:https://blog.csdn.net/weixin_45662399/article/details/136801261

【目标检测经典算法】R-CNN、Fast R-CNN和Faster R-CNN详解系列二：Fast R-CNN图文详解

概念预设

感受野

感受野(Receptive Field) 是指特征图上的某个点能看到的输入图像的区域。

神经元感受野的值越大表示其能接触到的原始图像范围就越大，也意味着它可能蕴含更为全局，语义层次更高的特征；
值越小则表示其所包含的特征越趋向局部和细节。

在这里插入图片描述
在论文中，ZF网络特征图中 $3 * 3$ 的滑动窗口在原图中的感受野为 $171 * 171$

RPN

框架

Faster R-CNN不再需要SS算法进行候选框的生成，而是使用RPN进行锚框的生成和筛选，可以和分类回归任务放在一起进行实现，是一个一阶段任务。
在这里插入图片描述

anchor box

什么是anchors

在图像上预设好的不同大小，不同长宽比的参照框。 论文中设定每个区域可以生成k个anchor box。
在这里插入图片描述

anchors的大小和比例

由于每个目标的大小不同，所以会预设的anchors的大小和长宽比也不同。

在论文中预设了3种不同的面积和3种不同的比例大小的anchors：

$128 * 128, 256 * 256, 512 * 512$
$1 : 1, 1 : 2, 2 : 1$

因此一共会有9个anchors生成。
在这里插入图片描述

步骤

在这里插入图片描述

1. 滑动窗口

将图片输入网络得到相应的特征图后，将有一个3*3的滑动窗口在特征图上进行滑动，每滑动到一个新的位置，就生成一个一维向量（维度由所使用的backbone决定），在一维向量的基础上连接两个全连接层（cls layer和reg layer），获得2k个分类参数和4k个位置参数。

2k: 正样本概率和负样本概率
4k：4个需要回归的位置参数， $d_x d_y$ ：anchors的中心坐标的偏移量， $d_w d_h$ ：宽和高的调整参数

2. 生成anchor box

在这里插入图片描述

根据滑动窗口所在的特征图的中心点坐标以及特征图和原图的比例还原找到原图中所在位置的中心点坐标，然后根据原图所在位置的中心点坐标生成k个anchors（图中假设k=3）,这些anchors中可能包含着需要检测的目标。

3. scores详解

一维向量通过 $1 * 1$ 、个数为2k的卷积核可以生成2k个分类scores，通过 $1 * 1$ 、个数为4k的卷积核可以生成4k个分类scores。

生成的参数具体代表的含义如下图所示。

在这里插入图片描述

4. anchors的筛选

将大量生成的anchors进行筛选和删除，再通过NMS进行重叠的候选框，最后剩下大约2000个候选框（和SS算法生成的候选框数量差不多）
在这里插入图片描述

5. 正负样本的采样

在这里插入图片描述

正样本：

与标注框的iou值>0.7的anchors
与标注框的iou值最大的anchors

一般第一条就完全可以生成足够的标注框，但是为了防止所有的anchors与标注框的交并比都不大于0.7的特殊情况，则加上了第二个条件

负样本：与所有的标注框的iou值都<0.3的anchors

总结

可以看到
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/754354.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

LeetCode链表hard 有思路？但写不出来？

LeetCode链表hard 有思路？但写不出来？

给你链表的头节点 head ，每 k 个节点一组进行翻转，请你返回修改后的链表。 k 是一个正整数，它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍，那么请将最后剩余的节点保持原有顺序。你不能只是单纯的改变节点内部的值…

阅读更多...

用docker启动centos的桌面环境

用docker启动centos的桌面环境

最近在dockerhub看见centos的桌面镜像拉取镜像：docker pull kasmweb/centos-7-desktop:1.14.0 VNC_PWpassword输入你自己的密码运行容器：docker run --rm -it --shm-size512m -p 6901:6901 -e VNC_PWpassword kasmweb/centos-7-desktop:1.14.0 该镜…

阅读更多...

记录一下小程序自定义导航栏消息未读已读小红点，以及分组件的消息数量数据实时读取

记录一下小程序自定义导航栏消息未读已读小红点，以及分组件的消息数量数据实时读取

本案例，Message 身为组件，使用不了任何钩子来重新获取 this.getMessageList() 消息列表使用 props 父子传参，因为 Message 组件使用不了页面生命周期从而无法拿到传递过来的数据使用 watch 监听不到 props 更不建议使用本地存储&#xff0c…

阅读更多...

Python 实现1~100之间的偶数求和

Python 实现1~100之间的偶数求和

result0 for i in range(101):if i%20:result result i print(result) 或者 result0 for i in range(2,101,2):result result i print(result)

阅读更多...

【附下载】3Ds Max从安装、配置到入门提高和高级用法

【附下载】3Ds Max从安装、配置到入门提高和高级用法

#3Ds Max 一、安装 1.1 安装说明地址：链接：https://pan.baidu.com/s/1lwKMbgbE32wCL6PpMv706A?pwddll8 提取码：dll8 –来自百度网盘超级会员V2的分享安装说明：文件夹里有安装说明安装解压即可关键就是将crack文件放到自己…

阅读更多...

LVS+Keepalived 高可用群集--部署

LVS+Keepalived 高可用群集--部署

实际操作 LVS Keepalived 高可用群集环境设备 LVS1192.168.6.88 （MASTER）LVS2192.168.6.87 （BACKUP）web1192.168.6.188web2192.168.6.189客户端192.168.6.86VIP192.168.6.180 （一）web服务器首先配置…

阅读更多...

鸿蒙Harmony应用开发—ArkTS声明式开发（绘制组件：Polygon）

鸿蒙Harmony应用开发—ArkTS声明式开发（绘制组件：Polygon）

多边形绘制组件。说明： 该组件从API Version 7开始支持。后续版本如有新增内容，则采用上角标单独标记该内容的起始版本。子组件无接口 Polygon(value?: {width?: string | number, height?: string | number}) 从API version 9开始&#xff0…

阅读更多...

软件杯深度学习 python opencv 火焰检测识别火灾检测

软件杯深度学习 python opencv 火焰检测识别火灾检测

文章目录 0 前言1 基于YOLO的火焰检测与识别2 课题背景3 卷积神经网络3.1 卷积层3.2 池化层3.3 激活函数：3.4 全连接层3.5 使用tensorflow中keras模块实现卷积神经网络 4 YOLOV54.1 网络架构图4.2 输入端4.3 基准网络4.4 Neck网络4.5 Head输出层 5 数据集准备5.1 数…

阅读更多...

IPC之管道

IPC之管道

什么是管道？ 管道的本质是操作系统在内核中创建出的一块缓冲区，也就是内存管道的应用 $ ps aux | grep xxx ps aux 的标准输出写到管道，grep 从管道这块内存中读取数据来作为它的一个标准输入，而且 ps 和 grep 之间是兄弟关系&a…

阅读更多...

注册-前端部分

注册-前端部分

前提：后端jar环境、Vue3环境、Redis环境搭建页面（html标签、css样式） → 绑定数据与事件（表单校验） → 调用后台接口（接口文档、src/api/xx.js封装、页面函数中调用） Login.vue文件&#xff…

阅读更多...

CUDA学习笔记07：shared memory Code

CUDA学习笔记07：shared memory Code

参考视频宝藏up主！CUDA编程模型系列七(利用shared memory优化矩阵转置)_哔哩哔哩_bilibili 代码 #define BLOCK_SIZE 32 #define M 3000 #define N 1000__managed__ int matrix[N][M]; __managed__ int gpu_matrix[M][N]; __managed__ int cpu_matrix[M][N];__g…

阅读更多...

阻抗控制理解

阻抗控制理解

阻抗控制不是控制机器人位置或力，而是旨在塑造两者之间的动态关系 [4] , [5]，从而隐式控制与人类或环境交换的能量并防止不安全的相互作用。这允许安全地处理任务的所有部分，包括自由运动、运动学约束运动和动态约束运动，就像人机…

阅读更多...

代码随想录算法训练营第二十五天|39. 组合总和、40.组合总和II、131.分割回文串

代码随想录算法训练营第二十五天|39. 组合总和、40.组合总和II、131.分割回文串

文档讲解：39. 组合总和、40.组合总和II、131.分割回文串题目链接：39. 组合总和、40.组合总和II、131.分割回文串 216.组合总和III class Solution {List<List<Integer>> res new ArrayList<>();List<Integer> path new Arra…

阅读更多...

CentOS的安装

CentOS的安装

一、打开VMware的WorkStation的软件界面。点击创建新的虚拟机。二、我们选择自定义，下一步。三、这个界面不用动，直接进入下一步。四、点击稍后安装操作系统，下一步。五、选择Linux操作系统，版本为CentOS 7 64位。六、虚拟机…

阅读更多...

web集群(haproxy负载均衡+keepalived高可用)

web集群(haproxy负载均衡+keepalived高可用)

web集群(haproxy负载均衡keepalived高可用) 主机名主机IP地址lvs1haproxykeepalived192.168.88.38proxyhaproxykeepalived192.168.88.66web1nginx192.168.88.10web2nginx192.168.88.20 配置lvs1，proxy 安装haproxy [rootlvs1 ~]# yum -y install haproxy [rootl…

阅读更多...

Day69：WEB攻防-Java安全JWT攻防Swagger自动化算法签名密匙Druid泄漏

Day69：WEB攻防-Java安全JWT攻防Swagger自动化算法签名密匙Druid泄漏

目录 Java安全-Druid监控-未授权访问&信息泄漏黑盒发现白盒发现攻击点 Java安全-Swagger接口-导入&联动批量测试黑盒发现白盒发现自动化发包测试自动化漏洞测试 Java安全-JWT令牌-空算法&未签名&密匙提取识别 JWT 方式一：人工识…

阅读更多...

前端 -- 基础表单标签 -- 表单域

前端 -- 基础表单标签 -- 表单域

表单域 # 表单域是一个包含表单元素的区域在 HTML 标签中， <form> 标签用于定义表单域， 以实现用户信息的收集和传递简单通俗讲， 就是 <form> 会把它范围内的表单元素信息提交给后台（服务器) 对于上面讲…

阅读更多...

24计算机考研调剂 | 【官方】桂林理工大学（11自命题、22自命题）

24计算机考研调剂 | 【官方】桂林理工大学（11自命题、22自命题）

桂林理工大学信息工程与科学学院招收调剂考研调剂补充信息一、招收专业计算机科学与技术（学硕）、软件工程（学硕）、计算机技术（专硕）、人工智能（专硕）、软件工程（专…

阅读更多...

php版本的AI电话机器人系统有哪些优势

php版本的AI电话机器人系统有哪些优势

PHP版本的AI电话机器人系统具有以下优势： 提升客户体验：AI电话机器人能够为客户提供724小时的服务，无论何时客户有疑问或需要帮助，都可以得到及时响应1。提高工作效率和客户满意度：AI电话机器人系统具有智能回答问题…

阅读更多...

【Sass】1px分割线 + 缩进分割线

【Sass】1px分割线 + 缩进分割线

效果图 1. 亮色模式效果 2. 暗色模式效果设计思路配色使用grey色优点：无论在暗色模式还是亮色模式都可以看清楚分割线使用after,before 伪元素绘制线条，并压缩线条transform: scaleY(.25) 注意事项必须确保父级有宽高父级定位必须为position: r…

阅读更多...

最新文章