2D视觉检测算法整理

news/2025/7/6 5:48:14/文章来源:https://blog.csdn.net/slamer111/article/details/132063367

1.ROI pooling 和 ROI align的区别

ROI pooling第一步根据候选区域找特征图的位置，可能不是刚好对应，需要一次量化，如上图所示，第二次是特征图需要转化为特定的大小，这时候pooling可能也不能正好整除，所以第二次量化，这两次量化在像素级的任务上会有很大的误差。而align则不会量化，是直接取小数部分，最后每个格子分四块，求一个maxpooling，这四块区域的特征是通过双线性插值得到的。这样就没有量化导致的较大的损失。

2.YOLO3-YOLO5模型结构与正负样本分配策略

yolov3的网络结构DarkNet53和FPN的结构，多尺度预测，三个不同分辨率的特征图。

yolov5的输入端：mosaic数据增强，将四张图片随即缩放裁剪排布放在一起。

自适应锚框计算：根据不同数据集自适应的得到锚框的大小。

自适应图片缩放：不同分辨率的图片会变为同样的，进行黑边填充

模型端：

首先是FOCUS切片操作，降低计算量。

CSPNet结构：降低计算量，丰富梯度传播，将特征channel分为两份，不同的传播下去。

FPN+PAN的neck结构，相当于又将特征图传播上去了。

使用的CIOU-loss，GIOU-loss加上最大外接矩形，DIOU-loss加入中心点距离，CIOU-loss加入长宽比。

正负样本分配策略

yolov3的话是一个GT只有一个正样本，只在一个分辨率特征图上的一个网格里选择一个anchor为正。剩下的IOU小于阈值为负。

yolov4里面把GT先分到一个分辨率特征图里，每一个特征图分别进行正负样本计算，只要IOU大于阈值，就为正样本。

yolov5里面一个GT分给三个特征图，GT落在一个网格里，再找相近的两个网格，一个GT跟27个anchor匹配，只要宽高比小于阈值就为正。

3.yolov6-yolov7和yolox

4.sort和deepsort跟踪算法

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/18967.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【Linux命令200例】tee将输入内容输出到屏幕和文件

【Linux命令200例】tee将输入内容输出到屏幕和文件

🏆作者简介，黑夜开发者，全栈领域新星创作者✌，阿里云社区专家博主，2023年6月csdn上海赛道top4。 🏆本文已收录于专栏：Linux命令大全。 🏆本专栏我们会通过具体的系统的命令讲解加上鲜…

阅读更多...

C++ 类型转换 int, hex,char* float, string, wstring

C++ 类型转换 int, hex,char* float, string, wstring

日常的开发中经常会用到类型的相互转换，这里记录一下； 1, int转hex std::string IntToHex(int value) {stringstream ioss;ioss << std::hex << value;string temp;ioss >> temp;return temp;} 2, int转hex 设置宽度 std::string …

阅读更多...

计算机毕设深度学习猫狗分类 - python opencv cnn

计算机毕设深度学习猫狗分类 - python opencv cnn

文章目录 0 前言1 课题背景2 使用CNN进行猫狗分类3 数据集处理4 神经网络的编写5 Tensorflow计算图的构建6 模型的训练和测试7 预测效果8 最后 0 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往…

阅读更多...

Not allowed to load local resource: file:///D:/xxx.jpg

Not allowed to load local resource: file:///D:/xxx.jpg

问题： Not allowed to load local resource: file:///D:/xxx.jpg 出现以上情况的原因是浏览器不允许访问本地路径，所以你需要配置一个虚拟的路径代替本地的路径。解决方法： 思路：通过tomcat代理，在tomcat里写一个虚…

阅读更多...

mockery 模拟

mockery 模拟

composer地址：mockery/mockery - Packagist github地址：地址文档地址：Mockery — Mockery Docs 1.0-alpha documentation 根据文档介绍，mockery是php mock对象框架。根据js的mock框架的作用，估计mockery也是通过创…

阅读更多...

RocketMQ 在业务消息场景的优势详解

RocketMQ 在业务消息场景的优势详解

作者：隆基 01 消息场景 RocketMQ 5.0 是消息事件流一体的实时数据处理平台，是业务消息领域的事实标准，很多互联网公司在业务消息场景会使用 RocketMQ。我们反复提到的“消息、业务消息”，指的是分布式应用解耦，是 R…

阅读更多...

DSP开发：串口sci的发送与接收实现

DSP开发：串口sci的发送与接收实现

DSP开发：串口sci的发送与接收实现文章目录 DSP开发：串口sci的发送与接收实现串口配置串口SCI初始化详细分析串口SCI使用串口配置 /*--------------------------------------------scia----------------------------*/ /*----------------------------…

阅读更多...

七种遍历Map的方法

七种遍历Map的方法

七种遍历Map的方法 import java.util.HashMap; import java.util.Iterator; import java.util.Map;public class Wan {public static void main(String[] args) {Map<String,String> dataMap new HashMap<>();dataMap.put("A","Abb");dataMap…

阅读更多...

Linux系统CPU和磁盘性能进程分析工具pidstat

Linux系统CPU和磁盘性能进程分析工具pidstat

一、pidstat对CPU的分析 Linux 上的pidstat(1)工具按进程或线程打印CPU 用量，包括用户态和系统态时间的分解。默认情况下，仅循环输出活动进程的信息。例如： 这个例子捕捉到了系统备份，包含了tar(1)命令，从文件系统读取…

阅读更多...

攻防世界zorropub题解与subprocess模块

攻防世界zorropub题解与subprocess模块

目录题目分析： subprocess模块： subprocess.Popen()函数： subprocess.run()函数： 题目脚本： 在攻防世界做到一个题目感觉还挺有意思，记录一下这个放链接也只是攻防世界的页面，所以直接说…

阅读更多...

AI技术快讯：清华开源ChatGLM2双语对话语言模型

AI技术快讯：清华开源ChatGLM2双语对话语言模型

ChatGLM2-6B是一个开源项目，提供了ChatGLM2-6B模型的代码和资源。根据提供的搜索结果，以下是对该项目的介绍： 论文：https://arxiv.org/pdf/2103.10360.pdf ChatGLM2-6B是一个开源的双语对话语言模型，是ChatGLM-6B模…

阅读更多...

0802|IO进程线程day5 作业（打印时钟在终端上，若终端输入quit，结束时钟）

0802|IO进程线程day5 作业（打印时钟在终端上，若终端输入quit，结束时钟）

作业1：守护进程守护进程的创建（5步）： 创建孤儿进程：所有工作都在子进程中执行，从形式上脱离终端控制。 fork(), 退出父进程创建新的会话组：使子进程完全独立出来，防止兄弟进程对其…

阅读更多...

Python集成开发环境IDE：Spyder自动换行、函数列表outline、代码折叠

Python集成开发环境IDE：Spyder自动换行、函数列表outline、代码折叠

Spyder是一个用PythonQt编写的集成开发环境，包含许多有用的函数和工具。以下是一些常用功能： 变量浏览器：可以动态交互并修改变量，可以进行绘制直方图、时间序列，编辑日期框架或Numpy数组，对集合进行排序&…

阅读更多...

【python】两数之和 python实现（详细讲解）

【python】两数之和 python实现（详细讲解）

👉博__主👈：米码收割机 👉技__能👈：C/Python语言 👉公众号👈：测试开发自动化【获取源码商业合作】 👉荣__誉👈：阿里云博客专家博主、5…

阅读更多...

【Java可执行命令】（十三）策略工具policytool：界面化创建、编辑和管理策略文件中的权限和配置 ~

【Java可执行命令】（十三）策略工具policytool：界面化创建、编辑和管理策略文件中的权限和配置 ~

Java可执行命令之policytool 1️⃣ 概念2️⃣ 优势和缺点3️⃣ 使用3.1 使用方式3.2 使用技巧3.3 注意事项 4️⃣ 应用场景🌾 总结 1️⃣ 概念在Java平台上，安全性是至关重要的。为了提供细粒度的安全管理机制，Java引入了policytool命令。p…

阅读更多...

cmake使用笔记

cmake使用笔记

vim CMakeLists.txt mkdir build cd build cmake ..创建 CMakeLists.txt，添加内容 cmake_minimum_required(VERSION 3.26) #工程名称 project(hello) #宏定义 add_definitions(-D宏名称) #头文件路径 include_directories(${PROJECT_SOURCE_DIR}/inc) #搜索源文件…

阅读更多...

Python爬虫教程篇+图形化整理数据（数学建模可用）

Python爬虫教程篇+图形化整理数据（数学建模可用）

一、首先我们先看要求 1.写一个爬虫程序 2、爬取目标网站数据，关键项不能少于5项。 3、存储数据到数据库，可以进行增删改查操作。 4、扩展：将库中数据进行可视化展示。二、操作步骤： 首先我们根据要求找到一个适合自己的网…

阅读更多...

Socket本质、实战演示两个进程建立TCP连接通信的过程

Socket本质、实战演示两个进程建立TCP连接通信的过程

文章目录 Socket是什么引入面试题, 使你更深刻的理解四元组 Socket网络通信大体流程实战演示TCP连接建立过程需要用到的linux 查看网络的一些命令测试的程序一些准备工作启动服务端, 并没有调用accept启动客户端开启服务accept Socket是什么通俗来说,Socket是套接字,是一种编…

阅读更多...

InnoDB引擎底层逻辑讲解——架构之磁盘架构

InnoDB引擎底层逻辑讲解——架构之磁盘架构

1. System Tablespaces区域系统表空间是change buffer（更改缓冲区）的存放区域，这是在8.0之后重新规划的，在5.x版本的时候，系统表空间还会存放innodb的数据字典undolog日志等信息，在8.0之后主要主要存放更…

阅读更多...

常用椭圆曲线介绍

常用椭圆曲线介绍

chat-gpt生成，对应python的miracl/core/python库 ED系列一、ED25519 ED25519使用的椭圆曲线是Curve25519，它是一种高效且安全的椭圆曲线，由Daniel J. Bernstein等人设计。ED25519的密钥长度为256位，提供了128位的安全性。ED25…

阅读更多...

最新文章