YOLOv9来咧!

文章目录

    • 论文:
    • 主要内容
      • 一、提出使用PGI(Programmable Gradient Information,可编程梯度信息)来解决信息瓶颈问题和深度监督机制不适合轻量级神经网络的问题。
      • 二、设计了GELAN(Generalized ELAN ,广义ELAN),一个高效、轻量级的神经网络。
    • 效果如下

论文:

https://arxiv.org/html/2402.13616v1​arxiv.org/html/2402.13616v1
github代码
GitHub - WongKinYiu/yolov9: Implementation of paper - YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information​

主要内容

主要是提出了两点:

一、提出使用PGI(Programmable Gradient Information,可编程梯度信息)来解决信息瓶颈问题和深度监督机制不适合轻量级神经网络的问题。

论文中图3

图中(d)为提出的PGI。PGI主要包括三个组成部分,即(1)主分支,(2)辅助可逆分支,(3)多级辅助信息。其中推理过程仅使用 main 分支,因此不需要任何额外的推理成本。辅助可逆分支(auxiliary reversible branch)处理神经网络深化带来的问题。网络深化会造成信息瓶颈。多级辅助分支(multi-level auxiliary information),旨在处理深度监管导致的误差累积问题。

二、设计了GELAN(Generalized ELAN ,广义ELAN),一个高效、轻量级的神经网络。

在这里插入图片描述
图c为提出的GELAN,它结合了CSPNet 和 ELAN 。区别与ELAN,将ELAN仅使用卷积层堆叠的功能推广到可以使用任何计算块的新架构中(即图c中any block)。
在yolov9中,gelan被作为block用在了backbone中,关于Gyolov9的backbone以及GELAN运用详细信息见:

效果如下

在精度方面,新方法优于使用大数据集预训练的RT DETR [ 43],在参数利用率方面也优于基于深度卷积的设计YOLO MS 。
PGI的引入使得轻量级模型和深度模型都能在精度上实现显著的提升。结合PGI和GELAN设计的YOLOv9,展现了很强的竞争力。其出色的设计使得深度模型与YOLOv8相比,参数数量减少了49%,计算量减少了43%,但在MS COCO数据集上仍有0.6%的AP提升。
在这里插入图片描述

引用:
@article{wang2024yolov9,title={{YOLOv9}: Learning What You Want to Learn Using Programmable Gradient Information},author={Wang, Chien-Yao and Liao, Hong-Yuan Mark},booktitle={arXiv preprint arXiv:2402.13616}, year={2024}}
@article{chang2023yolor, title={{YOLOR}-Based Multi-Task Learning}, author={Chang, Hung-Shuo and Wang, Chien-Yao and Wang, Richard Robert and Chou, Gene and Liao, Hong-Yuan Mark}, ournal={arXiv preprint arXiv:2309.16921}, year={2023}}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/696430.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LLM 模型融合实践指南:低成本构建高性能语言模型

编者按:随着大语言模型技术的快速发展,模型融合成为一种低成本但高性能的模型构建新途径。本文作者 Maxime Labonne 利用 mergekit 库探索了四种模型融合方法:SLERP、TIES、DARE和passthrough。通过配置示例和案例分析,作者详细阐…

Ansible playbook 剧本部署WEB NFS rsync sersync(及时监控)架构

ansible playbook剧本介绍: playbook 是ansible用于配置,部署和管理被节点的剧本 由一个或多个模块组成,完成统一的目的,实现自动化操作 剧本编写需遵循yaml语法 yaml的三要素: 缩进:两个字符,默…

【Vue3】toRefs和toRef在reactive中的一些应用

💗💗💗欢迎来到我的博客,你将找到有关如何使用技术解决问题的文章,也会找到某个技术的学习路线。无论你是何种职业,我都希望我的博客对你有所帮助。最后不要忘记订阅我的博客以获取最新文章,也欢…

快速上手vue指南

Vue.js 是一款非常流行且易于上手的前端框架,用于构建用户界面和单页应用程序(SPA)。它以其简洁的API、灵活的组件系统和高效的性能著称。如果你是初学者,以下是一些关键步骤和建议,可以帮助你快速上手 Vue.js。 1. 理…

【Qt】实现 Ctrl + 鼠标滚轮 缩放文本功能

【Qt】实现 Ctrl 鼠标滚轮 缩放文本功能 文章目录 I - 实现自定义控件II - 完整代码III - 参考链接 I - 实现自定义控件 主要原理 继承 QTextEdit 或者 QPlainTextEdit 类,重写滚轮事件 wheelEvent, QTextEdit 和 QPlainTextEdit 中均包含此函数 头文件 TextEdit…

学习springMVC第二天

REST简介 REST(Representational State Transfer),表现形式状态转换 传统风格资源描述形式 http://localhost/user/getById?id1 http://localhost/user/saveUser REST风格描述形式 http://localhost/user/1 http://localhost/user 优点: 隐藏资源的访问…

C++模板->模板的概念、函数模板基本语法、函数模板注意事项、普通函数与函数模板区别、普通函数与函数模板调用规则、模板的局限性

#include<iostream> using namespace std; //交换两个整型函数 void swapInt(int& a, int& b) { int temp a; a b; b temp; } //交换两个浮点型函数 void swapDouble(double& a, double& b) { double temp a; a b; b te…

MATLAB中gtext函数用法

目录 语法 说明 示例 使用鼠标将文本添加到图窗 指定字体大小和颜色 在创建后修改文本 gtext函数的功能是使用鼠标将文本添加到图窗。 语法 gtext(str) gtext(str,Name,Value) t gtext(___) 说明 gtext(str) 在使用鼠标选择的位置插入文本 str。当将鼠标指针悬停在图…

Oracle普通用户启停JOB报错ORA 27486权限不足

Oracle普通用户启停JOB报错ORA 27486权限不足 问题与现象原因与对策 问题与现象 应用用户通过DBMS_SCHEDULER启停自己的JOB需要的权限&#xff1a; grant execute on dbms_scheduler to appuser;该普通用户有CREATE JOB的权限。通过DBMS_SCHEDULER停止自己的JOB时&#xff1a…

3个wordpress中文企业主题模板

农业畜牧养殖wordpress主题 简洁大气的农业畜牧养殖wordpress主题&#xff0c;农业农村现代化&#xff0c;离不开新农人、新技术。 https://www.jianzhanpress.com/?p3051 老年公寓wordpress主题 浅绿色简洁实用的老年公寓wordpress主题&#xff0c;适合做养老业务的老年公…

高标准农田仪器设备

在当今社会中&#xff0c;农业已经逐渐走向了一条科技化、智能化的道路。高标准农田建设成为了现代化农业发展的一个重要方向。为了更好地提高农产品的产量和品质&#xff0c;科技人员们不断地在农田设备上进行创造性的改进与升级&#xff0c;以达到更加高效、节能、环保、智能…

SouthLeetCode-打卡24年02月第3周

SouthLeetCode-打卡24年02月第3周 // Date : 2024/02/12 ~ 202X/02/18 049.反转字符串 (1) 题目描述 049#LeetCode.344.简单题目链接#Monday2024/02/12 编写一个函数&#xff0c;其作用是将输入的字符串反转过来。输入字符串以字符数组 s 的形式给出。 不要给另外的数组分…

【C语言】注释

&#x1f388;个人主页&#xff1a;豌豆射手^ &#x1f389;欢迎 &#x1f44d;点赞✍评论⭐收藏 &#x1f917;收录专栏&#xff1a;C语言 &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出指正&#xff0c;让我们共同学习、交流进步&…

计算机网络--物理层练习题

习题 下列说法正确的是&#xff08;D&#xff09; A 信道与通信电路类似&#xff0c;一条可通信的电路往往包含一个信道 信道不等于通信电路&#xff0c;一条可双向通信的电路往往包含两个信道&#xff1a;一个是发送信道&#xff0c;一条是接收信道。另外&#xff0c;多个通…

【国际化】用JQuery-i18next的国际化demo,引入json

参考&#xff1a; 使用 i18next 的 jQuery 国际化 &#xff08;i18n&#xff09; 渐进式指南 (locize.com) i18next-http-backend/example/jquery/index.html at master i18next/i18next-http-backend (github.com) 文档 可能需要解决一下跨域问题&#xff0c;因为浏览器读取本…

Unity学习之Unity中的MVC思想

文章目录 1 前言2 MVC的基本概念3 不使用MVC思想制作UI逻辑3.1 拼面板3.2 面板脚本3.3 角色面板逻辑3.4 角色升级 4 使用MVC思想制作UI逻辑4.1 Model数据脚本4.2 View界面脚本4.2.1 MainView主界面4.2.2 RoleView 角色面板界面 4.3 Controller业务逻辑脚本4.3.1 MainController…

【开源软件????】

开源软件的影响力在当今的科技领域越来越显著&#xff0c;它已经成为软件开发的主流趋势之一。开源软件具有开放源代码、可免费使用、可自由分发等特点&#xff0c;这使得它在全球范围内得到了广泛的应用和支持。本文将围绕开源软件如何推动技术创新、开源软件的商业模式、开源…

phaseDNN文章解读

文章DOI: https://doi.org/10.48550/arXiv.1905.01389 作者是 Southern Methodist University 的Wei Cai 教授 A Parallel Phase Shift Deep Neural Network for Adaptive Wideband Learning 一种并行移相深度神经网络来自适应学习宽带频率信号 20190514 核心思想&#xff1a;…

跟着pink老师前端入门教程(JavaScript)-day05

六、语句 &#xff08;一&#xff09;表达式和语句 1、表达式 表达式是可以被求值的代码&#xff0c;JavaScript 引擎会将其计算出一个结果。 2、语句 语句是一段可以执行的代码。 比如&#xff1a; prompt() 可以弹出一个输入框&#xff0c;还有 if语句 for 循环语句等…

h5 js监听手机切到后台和切回

在H5中可以使用JavaScript来监听手机从前台切换到后台或者从后台切换回前台的事件。 监听页面进入/退出后台&#xff08;切换到其他应用&#xff09;&#xff1a; document.addEventListener(visibilitychange, function() {if (document.hidden) { // 当页面被切换至后台时c…