背景 该论文是在BEVDet的基础上进行了一个调整优化,传统的方法是将特征图与深度预测进行外积得到视椎特征图,再将它与预处理好的体素索引结合,将每个视椎特征分类到每个voxel中进行累加和的操作。BEVFusion与BEVDepth等方法是避免了累加和,而是使用多线程的方法加速这个步骤,但它还是避免不了计算视椎特征并存储,显存与速度随着分辨率提高会效果不佳。 方法 本文给出的解决方法很简单,它此外又提前计算出了视椎特征相对于原图的索引,如右图所示,这样就不用显式计算存储视椎特征了,这个大大降低了推理速度。