YOLOX-PAI 论文学习

news/2025/7/17 12:45:59/文章来源:https://blog.csdn.net/calvinpaean/article/details/131916715

1. 解决了什么问题？

对 YOLOX 做加速，在单张 Tesla V100 上取得了 $42.8$ mAP，推理速度为 1 毫秒。

2. 提出了什么方法？

2.1 主干网络

YOLOv6 和 PP-YOLOE 都将主干网络从 CSPNet 切换到了 RepVGG。RepVGG 在推理时，会用 $3\times 3$ 卷积替换多分支结构，这能节约推理时间、提高检测效果。于是，YOLOX-PAI 也选用 RepVGG 作为主干网络。

2.2 Neck

作者选择了两种方法来优化 YOLOX-PAI 的 neck，一个是 Adaptively Spatial Feature Fusion(ASFF)，及其变体形式（记做 ASFF_Sim），用于特征增强；另一个是轻量级的卷积模块 GSConv，降低计算成本。

ASFF 使用多个卷积模块，统一不同特征图的维度。受到 YOLOv5 中 Focus 层的启发，使用 Slice 操作和均值操作，得到一个统一的特征图（记做 ASFF_Sim）。具体可看下图 ASFF_Sim 的操作，Expand 操作是基于 Focus 层的 Slice 操作。
在这里插入图片描述

如下图所示，作者使用了两种基于 GSConv 的 necks 来优化 YOLOX。GSConv 特别针对那些通道数最大、特征图最小的 neck 设计的。
在这里插入图片描述

2.3 Head

作者使用了注意力机制来增强 YOLOX-Head，对齐目标检测和分类任务（记做 TOOD-Head）。如下图，首先使用一个 stem 层降低通道数，然后是一组中间卷积层，得到中间特征图。最后，根据不同的任务计算出自适应权重。
在这里插入图片描述

2.4 PAI-Blade

PAI-Blade 是用于模型加速的推理优化框架。它使用了许多优化技术，如 Blade Graph Optimizer、TensorRT、PAI-TAO（Tensor accelerator and Optimizer）。PAI-Blade 自动搜索优化的最佳方案。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/8747.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

MyBatis学习笔记之高级映射及延迟加载

MyBatis学习笔记之高级映射及延迟加载

文章目录环境搭建，数据配置多对一的映射的思路逻辑级联属性映射association分布查询一对多的映射的思路逻辑collection分布环境搭建，数据配置 t_class表 t_stu表多对一的映射的思路逻辑多对一：多个学生对应一个班级多的一方是st…

阅读更多...

Anaconda常用命令

Anaconda常用命令

Anaconda常用命令文章目录 Anaconda常用命令1. 前言2. 管理conda自身2.1 查看conda版本2.2 查看conda的环境配置2.3 设置镜像2.4 更新conda2.6 更新Anaconda整体2.7 查询某个命令的帮助 3. 管理环境3.1 创建虚拟环境3.2 创建虚拟环境的同时安装必要的包3.3 查看有哪些虚拟环境…

阅读更多...

redis缓存穿透

redis缓存穿透

缓存穿透是指在缓存中查询大量不存在的数据，导致无效请求直接落到后端数据库，从而造成数据库负载过高，甚至引起数据库超负荷的情况。缓存穿透通常发生在恶意攻击或非法请求的情况下，攻击者故意查询不存在的数据，导致大…

阅读更多...

mac系统占用100多G怎么清除 mac内存系统占用了好多怎么清理

mac系统占用100多G怎么清除 mac内存系统占用了好多怎么清理

mac电脑运行速度足以傲视其他电脑系统，不易卡顿死机是苹果电脑的优势，但是其偏小的存储空间令人十分头痛。如果你的mac磁盘容量是仅有12GB，在使用一段时间之后，系统内存很有可能就要占用100多G，很快电脑会出现空间不够…

阅读更多...

【Odoo16前端源码分析】接口web_search_read

【Odoo16前端源码分析】接口web_search_read

接口名称: web_search_read 请求路径: /web/dataset/call_kw/project.project/web_search_read 内容主题: 请求参数kwargs中fields的来源分析以list类型为例 1 先转成archInfo对象，其中有activeFileds属性 /* web/static/src/views/list/list_view.js */expor…

阅读更多...

Android12之快速查找静态注册jni函数方法(一百六十一)

Android12之快速查找静态注册jni函数方法(一百六十一)

简介： CSDN博客专家，专注Android/Linux系统，分享多mic语音方案、音视频、编解码等技术，与大家一起成长！ 优质专栏：Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言： 人生…

阅读更多...

【C语言15】单链表，（对于二级指针与一级指针应用的详细讲述）

【C语言15】单链表，（对于二级指针与一级指针应用的详细讲述）

文章目录单链表1.单链表的介绍2.单链表的实现2.1.1单链表结点的创建与销毁2.1.2单链表尾插2.1.3单链表打印2.1.4尾删2.1.5头插2.1.6头删2.1.7查找2.1.8在pos位置之后插入数据2.1.9删除pos位置单链表 1.单链表的介绍链表是一种物理存储结构上非连续、非顺序的存储结构&#…

阅读更多...

通达OA-V12版本二次开发-2023年7月25日

通达OA-V12版本二次开发-2023年7月25日

通达OA-V12版本二次开发-2023年7月25日 1、解密V11版本的文件2、修改V11的文件3、修改mysql_为mysqli_。4、关闭文件，windows下的记事本方式打开，然后另存为utf-8文件。5、V12版本相对于V11版本，改动内容 1、解密V11版本的文件免费解密工具…

阅读更多...

Vue 本地应用图片切换 v-show v-bind实践

Vue 本地应用图片切换 v-show v-bind实践

点击切换图片的本质，其实修改的是img标签的src属性。图片的地址有很多个，在js当中通过数组来保存多个数据，数组的取值结合索引，根据索引可以来判断是否是第一张还是最后一张。图片的变化本质是src属性被修改了，属性…

阅读更多...

国标GB28181视频监控平台EasyGBS视频无法播放，抓包返回ICMP是什么原因？

国标GB28181视频监控平台EasyGBS视频无法播放，抓包返回ICMP是什么原因？

国标GB28181视频平台EasyGBS是基于国标GB/T28181协议的行业内安防视频流媒体能力平台，可实现的视频功能包括：实时监控直播、录像、检索与回看、语音对讲、云存储、告警、平台级联等功能。国标GB28181视频监控平台部署简单、可拓展性强，支持将…

阅读更多...

Python原型模式介绍、使用；浅拷贝/深拷贝原理

Python原型模式介绍、使用；浅拷贝/深拷贝原理

一、Python原型模式（Prototype Pattern）简介 1. 概念原型模式是一种创建型设计模式，它通过复制（克隆）现有对象来创建新对象。这样可以避免使用复杂的构造函数来创建对象，提高程序的性能和可维护性。 2. 功…

阅读更多...

腾讯云tke-ingress开启ingress域名访问日志

腾讯云tke-ingress开启ingress域名访问日志

容器类型为containers的tke集群控制台创建完ingress-controller之后，由于默认日志是打印在pod内的文件，现在需要自行收集访问日志，需要把日志打印在正常的pod输出上在收集在ingress-controller中默认nginx配置为 access-log-path: /var/log…

阅读更多...

redis 缓存穿透缓存击穿缓存雪崩

redis 缓存穿透缓存击穿缓存雪崩

redis 缓存穿透缓存击穿缓存雪崩 1.缓存穿透前提：应用服务器压力过大 > 导致redis命中率过低（查询不到缓存）> 一直查询数据库描述：1.redis查询不到数据 2.出现很多非正常url访问（一般出现这些问题都是恶意…

阅读更多...

独立站运营简历怎么写？如何做自建站履历？编写独立站经营履历的要点是什么？如何在简历中呈现个人自建站运营经验？

独立站运营简历怎么写？如何做自建站履历？编写独立站经营履历的要点是什么？如何在简历中呈现个人自建站运营经验？

作为一名独立站运营者，一份出色的简历是展示自己能力的重要途径。一个精心制作的独立站运营简历可以为宝子们赢得心仪职位的机会。接下来，我们将介绍如何写一份引人注目的独立站运营简历，从而吸引雇主的目光。独立站运营简历：个…

阅读更多...

微服务——统一网关Getway

微服务——统一网关Getway

为什么需要网关？ 网关的两种实现: 网关Getway——快速入门步骤一网关背身也是一个微服务，需要注册到nacos中去步骤二成功运行后可以通过网关进行请求转发到对应服务。流程如下： 路由断言工厂网关路由可以配置的东西有如下。 spri…

阅读更多...

【深度学习】yolov 图片训练的时候的遇到的warning： corrupt JPEG restored and saved

【深度学习】yolov 图片训练的时候的遇到的warning： corrupt JPEG restored and saved

报错原因是图片在dataset.py 走验证时报的错误。 if im.format.lower() in (jpg, jpeg):with open(im_file, rb) as f:f.seek(-2, 2)if f.read() ! b\xff\xd9: # corrupt JPEGImageOps.exif_transpose(Image.open(im_file)).save(im_file, JPEG, subsampling0, quality100)m…

阅读更多...

Redis 九种数据类型的基本操作

Redis 九种数据类型的基本操作

一、redis9种数据类型的基本操作 ①key操作 #查找所有的key 127.0.0.1:6379> keys * 1) "pop" 2) "mylist" 3) "lpl" 4) "myset" #设置key的过期时间返回1表示执行成功，0表示失败，出现问题 127.0.0.1:6379…

阅读更多...

Qt Creator mainwindow.obj:-1: error: LNK2019

Qt Creator mainwindow.obj:-1: error: LNK2019

构建的时候报错： mainwindow.obj:-1: error: LNK2019: 无法解析的外部符号 "public: __thiscall mynotedig::mynotedig(class QWidget *)" (??0mynotedigQAEPAVQWidgetZ)，该符号在函数 "public: void __thiscall MainWindow::mynoteab…

阅读更多...

VMPWN的入门级别题目详解（一）

VMPWN的入门级别题目详解（一）

实验一 VMPWN1 题目简介这是一道基础的VM相关题目，VMPWN的入门级别题目。前面提到VMPWN一般都是接收字节码然后对字节码进行解析，但是这道题目不接受字节码，它接收字节码的更高一级语言：汇编。程序直接接收类似”mov”、”add”…

阅读更多...

前端面试题：探索前沿技术与知识深度的关键

前端面试题：探索前沿技术与知识深度的关键

在前端开发领域，面试是评估候选人技能和知识水平的重要环节。面试题涵盖了各个方面的前端知识，旨在考察候选人的理解能力和解决问题的能力。本文将介绍一些常见的前端面试题，并结合具体实例说明，帮助读者更好地理解和准备前端面试…

阅读更多...

最新文章