参考代码:ADMap
动机与出发点
局部地图构建算法在实际中会遇到部分车道线偏离的或是错误的情况,这往往是全局信息获取上存在欠缺,毕竟地图元素的回归很依赖于全局信息的获取。那么从特征提取、attention layer设计和loss构建上可以做一些工作,也就是文中提到的MPN(multi-scale perception network)、IIA(Ins. Interactive Attention)以及VDDL(Vector Direction Difference Loss)。其实抛开多模态特征融合网络部分不谈,起关键作用的是IIA,而且其中的inter和intra两个类型的attention具体哪个模块起的作用更大和摆放的位置在之前的工作中已经有了实验和说明了。
方法设计
文章的网络结构见下图:
在上图中描绘了文章的两个工作MPN和IIA,前一个用于融合Camera和Lidar的信息,后一个用于增强query内部的信息关联。MPN的结构在上图中已经和清楚了,也就是使用多尺度的方式融合不同模态信息。IIA就是在原本transformer layer的基础上增加intra和inter维度的attention,但是缺少更加细致分析。而VDDL就是刻画点和点之间的角度关系,希望用这个关系来约束元素的几何位置和相对关系,但是这个的影响力相对来说比IIA会弱一些。
文章提到的几个模块对于性能的影响:
将IIA与MapTR-v2版本中的Decoupled self-attention(DSA,看作是对transformer中self-attn的替换)的比较:
实验结果
文章的方案与其它一些方法的对比: