简介:1.该教程提供大量的首发改进的方式,降低上手难度,多种结构改进,助力寻找创新点!
2.本篇文章对Pointnet++特征提取模块进行改进,加入
HeatBlock,提升性能。
3.专栏持续更新,紧随最新的研究内容。
目录
1.理论介绍
2.修改步骤
2.1 步骤一
2.2 步骤二
2.3 步骤三
1.理论介绍
学习鲁棒性和表达性视觉表征的一个基本问题是如何有效地估计整个图像中视觉语义的空间关系。在这项研究中,我们提出了一种新的视觉骨干模型vHeat,同时实现了高计算效率和全局接受野。受热传导物理原理的启发,其基本思想是将图像块概念化为热源,并将其相关性的计算建模为热能的扩散。该机制通过新提出的热传导算子(HCO)模块整合到深度模型中,该模块在物理上是合理的,可以使用DCT和IDCT操作有效地实现,复杂度为0 (N1.5)。广泛的实验表明,vHeat在各种视觉任务中超越视觉变压器(ViTs),同时还提供更高的推理速度,更低的FLOPs和更低的高分辨率图像GPU内存使用。