2D视觉检测算法整理

1.ROI pooling 和 ROI align的区别

 ROI pooling第一步根据候选区域找特征图的位置,可能不是刚好对应,需要一次量化,如上图所示,第二次是特征图需要转化为特定的大小,这时候pooling可能也不能正好整除,所以第二次量化,这两次量化在像素级的任务上会有很大的误差。而align则不会量化,是直接取小数部分,最后每个格子分四块,求一个maxpooling,这四块区域的特征是通过双线性插值得到的。这样就没有量化导致的较大的损失。

2.YOLO3-YOLO5模型结构与正负样本分配策略

 yolov3的网络结构DarkNet53和FPN的结构,多尺度预测,三个不同分辨率的特征图。

 yolov5的输入端:mosaic数据增强,将四张图片随即缩放裁剪排布放在一起。

自适应锚框计算:根据不同数据集自适应的得到锚框的大小。

自适应图片缩放:不同分辨率的图片会变为同样的,进行黑边填充

模型端:

 首先是FOCUS切片操作,降低计算量。

CSPNet结构:降低计算量,丰富梯度传播,将特征channel分为两份,不同的传播下去。

FPN+PAN的neck结构,相当于又将特征图传播上去了。

使用的CIOU-loss,GIOU-loss加上最大外接矩形,DIOU-loss加入中心点距离,CIOU-loss加入长宽比。

正负样本分配策略

yolov3的话是一个GT只有一个正样本,只在一个分辨率特征图上的一个网格里选择一个anchor为正。剩下的IOU小于阈值为负。

yolov4里面把GT先分到一个分辨率特征图里,每一个特征图分别进行正负样本计算,只要IOU大于阈值,就为正样本。

yolov5里面一个GT分给三个特征图,GT落在一个网格里,再找相近的两个网格,一个GT跟27个anchor匹配,只要宽高比小于阈值就为正。

3.yolov6-yolov7和yolox

4.sort和deepsort跟踪算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/18967.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Linux命令200例】tee将输入内容输出到屏幕和文件

🏆作者简介,黑夜开发者,全栈领域新星创作者✌,阿里云社区专家博主,2023年6月csdn上海赛道top4。 🏆本文已收录于专栏:Linux命令大全。 🏆本专栏我们会通过具体的系统的命令讲解加上鲜…

计算机毕设 深度学习猫狗分类 - python opencv cnn

文章目录 0 前言1 课题背景2 使用CNN进行猫狗分类3 数据集处理4 神经网络的编写5 Tensorflow计算图的构建6 模型的训练和测试7 预测效果8 最后 0 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往…

RocketMQ 在业务消息场景的优势详解

作者:隆基 01 消息场景 RocketMQ 5.0 是消息事件流一体的实时数据处理平台,是业务消息领域的事实标准,很多互联网公司在业务消息场景会使用 RocketMQ。 我们反复提到的“消息、业务消息”,指的是分布式应用解耦,是 R…

Linux系统CPU和磁盘性能进程分析工具pidstat

一、pidstat对CPU的分析 Linux 上的pidstat(1)工具按进程或线程打印CPU 用量,包括用户态和系统态时间的分解。默认情况下,仅循环输出活动进程的信息。例如: 这个例子捕捉到了系统备份,包含了tar(1)命令,从文件系统读取…

攻防世界zorropub题解与subprocess模块

目录 题目分析: subprocess模块: subprocess.Popen()函数: subprocess.run()函数: 题目脚本: 在攻防世界做到一个题目感觉还挺有意思,记录一下 这个放链接也只是攻防世界的页面,所以直接说…

AI技术快讯:清华开源ChatGLM2双语对话语言模型

ChatGLM2-6B是一个开源项目,提供了ChatGLM2-6B模型的代码和资源。根据提供的搜索结果,以下是对该项目的介绍: 论文:https://arxiv.org/pdf/2103.10360.pdf ChatGLM2-6B是一个开源的双语对话语言模型,是ChatGLM-6B模…

0802|IO进程线程day5 作业(打印时钟在终端上,若终端输入quit,结束时钟)

作业1:守护进程 守护进程的创建(5步): 创建孤儿进程:所有工作都在子进程中执行,从形式上脱离终端控制。 fork(), 退出父进程 创建新的会话组:使子进程完全独立出来,防止兄弟进程对其…

Python集成开发环境IDE:Spyder自动换行、函数列表outline、代码折叠

Spyder是一个用PythonQt编写的集成开发环境,包含许多有用的函数和工具。以下是一些常用功能: 变量浏览器:可以动态交互并修改变量,可以进行绘制直方图、时间序列,编辑日期框架或Numpy数组,对集合进行排序&…

【python】两数之和 python实现(详细讲解)

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…

【Java可执行命令】(十三)策略工具policytool:界面化创建、编辑和管理策略文件中的权限和配置 ~

Java可执行命令之policytool 1️⃣ 概念2️⃣ 优势和缺点3️⃣ 使用3.1 使用方式3.2 使用技巧3.3 注意事项 4️⃣ 应用场景🌾 总结 1️⃣ 概念 在Java平台上,安全性是至关重要的。为了提供细粒度的安全管理机制,Java引入了policytool命令。p…

cmake使用笔记

vim CMakeLists.txt mkdir build cd build cmake ..创建 CMakeLists.txt,添加内容 cmake_minimum_required(VERSION 3.26) #工程名称 project(hello) #宏定义 add_definitions(-D宏名称) #头文件路径 include_directories(${PROJECT_SOURCE_DIR}/inc) #搜索源文件…

Python爬虫教程篇+图形化整理数据(数学建模可用)

一、首先我们先看要求 1.写一个爬虫程序 2、爬取目标网站数据,关键项不能少于5项。 3、存储数据到数据库,可以进行增删改查操作。 4、扩展:将库中数据进行可视化展示。 二、操作步骤: 首先我们根据要求找到一个适合自己的网…

Socket本质、实战演示两个进程建立TCP连接通信的过程

文章目录 Socket是什么引入面试题, 使你更深刻的理解四元组 Socket网络通信大体流程实战演示TCP连接建立过程需要用到的linux 查看网络的一些命令测试的程序一些准备工作启动服务端, 并没有调用accept启动客户端开启服务accept Socket是什么 通俗来说,Socket是套接字,是一种编…

InnoDB引擎底层逻辑讲解——架构之磁盘架构

1. System Tablespaces区域 系统表空间是change buffer(更改缓冲区)的存放区域,这是在8.0之后重新规划的,在5.x版本的时候,系统表空间还会存放innodb的数据字典undolog日志等信息,在8.0之后主要主要存放更…

Gitlab CI/CD笔记-第一天-GitOps和以前的和jenkins的集成的区别

一、GitOps-CI/CD的流程图 简单解释: 1.提交代码 2.编译构建 3.测试 4.部署 二、gitlab的实现 1、Runer 1.这个就是jenkins里的worker-slave的角色, 2.git-lab server 下发任务,Runner执行。 3.这个R…

关于样本方差为什么除以 n-1

今天上午集训摸鱼看到同学给我发的这个问题感觉挺有意思的 感性理解 这一部分的内容仅代表本蒟蒻没看严谨证明之前的个人见解,如果您想看严谨的证明,请翻到下一部分 还是先把图放上来罢省的有人不知道讲的什么东西 呃我知道这是生物竞赛的东西&#…

下载列表视频的具体操作

主要是介绍怎样获取上篇博客需要的HAR文件和请求域名

docker: Error response from daemon: No command specified.

执行 docker run -it -d -v /home/dell/workspace/workspace/test_192.168.1.202_pipeline:/home/workspace1 --name test_192.168.1.202_pipeline_10 qnx:7.1报错 问题定位:export导入的镜像需要带上command,以下命令查看command信息 docker ps --no…

十进制、八进制、二进制、十六进制

十进制 每一位都有 0~9 十个数码,逢十进一 二进制 每一位仅有 0 和 1 两个数码,逢二进一 八进制 每一位都有 0~7 八个数码,逢八进一 十六进制 每一位都有 0~9、A(10)、B(11)、C(12)、D(13)、E(14)、F(15),十六个数码&#…

牛客网Verilog刷题——VL53

牛客网Verilog刷题——VL53 题目答案 题目 设计一个单端口RAM,它有: 写接口,读接口,地址接口,时钟接口和复位;存储宽度是4位,深度128。注意rst为低电平复位。模块的接口示意图如下。 输入输出描…