在视觉感知技术中,理解和描述复杂的三维室外场景至关重要,尤其是自动驾驶技术的发展要求对陌生环境具有更强的适应能力和鲁棒性。传统上,使用“曼哈顿世界”和“亚特兰大世界”模型来描述具有垂直和水平结构的城市场景。
当遇到像香港这样地形复杂或发展中的城市区域时,这些模型就存在明显的局限性。为了处理这些复杂且不规则的场景,研究者提出了“香港世界”模型。该模型比曼哈顿和亚特兰大世界更为通用,不仅可以描述垂直和水平结构,还能处理斜坡和倾斜建筑。
简介
研究人员已经深入研究了结构化环境,尤其是在计算机视觉和机器人领域。传统上,此方法使用了“曼哈顿世界”和“亚特兰大世界”模型来描述城市中的场景:
●曼哈顿世界:假设城市中的建筑和街道都是垂直或水平排列的,这些方向都是互相正交的。
●亚特兰大世界:扩展了曼哈顿世界的概念,假设除了垂直方向外,还有多个不一定相互正交的水平方向。
虽然这些模型在描述平坦的城市区域时效果很好,但当此方法面对像香港这样的复杂地形时,它们就不够用了。香港的地形包括许多坡度和斜面,传统的模型难以准确描述这种环境。同样的问题也出现在“山城”重庆。
为了解决这些问题,本文提出了一种新的模型,叫做“香港世界”。这个模型不仅能描述垂直和水平的结构,还能处理各种斜坡和倾斜的建筑结构。这样,不仅可以描述平坦的高楼大厦,还能精确描绘建在山坡上的房屋。
在“香港世界”中,存在这样几种主要的方向:
●垂直方向,与所有水平方向正交。比如房屋是沿重力方向建造的;
●每个水平方向,与一组倾斜方向正交。比如房屋的墙壁与斜坡道路相邻;
●多对水平和倾斜方向互相正交。例如,两面相互垂直的墙壁,或者车道线与斜坡法线;
●基于这些方向,通过一组共享公共垂直轴或水平轴的坐标系来建模“香港世界”。这样,“香港世界”就像是亚特兰大世界的升级版,可以表示更多样化的环境。
“香港世界”模型有两个主要优势:
●它比曼哈顿和亚特兰大世界更通用,可以描述有坡度的环境,如有丘陵的城市、有斜屋顶的房屋和有楼梯的公寓;
●它比混合曼哈顿世界模型更紧凑和准确,因为它的方向是紧密联系在一起的。
“香港世界”模型在3D重建、场景理解和机器人导航等领域有广泛的潜在应用。此方法重点讨论其在机器人导航中的关键技术--SLAM中的应用。现有的基于点的SLAM方法在没有纹理的环境中表现不稳定。为了解决这个问题,已经提出了几种基于线的SLAM方法。然而,这些方法忽略了3D线之间的空间关系,而这些关系可以提供有效的几何约束,因此它们的精度不够理想。相比之下,最近的基于线的方法考虑了结构化场景中3D线之间的特定空间关系,如平行和正交。尽管这些方法提高了精度,但其适用范围有限,仅适用于曼哈顿和亚特兰大世界。为了克服这一限制,研究者提出了一种利用“香港世界”结构特征的单目基于线的SLAM方法。
这种SLAM方法具有很高的可靠性,主要得益于三项技术创新:
●通过半搜索的方法来估计“香港世界”中的主导方向和消失点。
●通过利用“香港世界”中主导方向之间的空间关系来计算相机的姿态,这种方法生成简洁的多项式,比现有的针对非结构化场景的方法更准确和高效。
●通过一种新的基于滤波的方法来优化估计的主导方向,然后使用这些优化后的主导方向来进一步优化相机姿态和3D线条,从而提高了准确性和鲁棒性。
这个SLAM方法中最大的亮点就是使用了消失点——这个相对于特征点提取,光流更少用到的方法来估算相机的位姿,对于这一点笔者将在方法部分详细介绍。