IEEE综述 | 车道拓扑推理20年演进:从程序化建模到车载传感器

导读

车道拓扑推理对于高精建图和自动驾驶应用至关重要,从早期的程序化建模方法发展到基于车载传感器的方法,但是很少有工作对车道拓扑推理技术进行全面概述。为此,本文系统性地调研了车道拓扑推理技术,同时确定了未来研究的挑战和机遇,旨在为研究者和从业者提供对这一快速发展领域的宝贵见解。

©️【深蓝AI】编译

本文由paper作者——Miao Fan授权【深蓝AI】编译发布!

论文题目:A Concise Survey on Lane Topology Reasoning for HD Mapping

论文作者:Yi Yao, Miao Fan, Shengtong Xu, Haoyi Xiong, Xiangzeng Liu, Wenbo Hu, Wenbing Huang

论文地址:https://arxiv.org/abs/2504.01989

1、摘要

车道拓扑推理技术在高精(HD)建图和自动驾驶应用中发挥着至关重要的作用。虽然近年来在该领域中取得了重大进展,但是很少有文献综合概述这些工作。本项调研系统性地回顾了车道拓扑推理方法的演变和现状,将其分为三种主要范式:基于程序化建模的方法、基于航拍图像的方法和基于车载传感器的方法。本文分析了从早期基于规则的方法到现代基于学习的解决方案的进展,这些基于学习的解决方案利用了transformers、图神经网络(GNNs)和其它深度学习架构。本文研究了标准化的评估指标,包括道路级指标(APLS和TLTS评分)和车道级指标(DET和TOP评分),以及在OpenLane-V2等基准数据集上的性能比较。本文确定了关键的技术挑战,包括数据集可用性和模型效率,并且总结了未来研究中有前景的方向。这篇综述为研究者和从业者提供了对高精建图应用中车道拓扑推理的理论框架、实际实现和新兴趋势的见解。

2、介绍

高精(HD)地图是自动驾驶的基础,它提供了道路网络、车道配置和交通元素的详细表示。在高精建图的各方面中,车道拓扑推理(理解不同车道如何相互连接和关联(见图3))对于安全且高效的自主导航尤为重要。在过去的二十年里,该领域发生了重大的演变,从简单的基于规则的方法发展到复杂的深度学习方法。

3|交叉路口处车道拓扑的示意图

车道拓扑推理方法的发展大致可分为三种主要范式。早期的方法依赖于程序化建模技术,利用计算机图形学和基于规则的系统来生成道路网络。这些方法较为基础,它们依赖于人工设计的规则并且缺乏灵活性,因此受到限制。基于航拍图像方法的出现标志着一项重大转变,它引入了计算机视觉技术从俯视图中提取道路拓扑结构。然而,这些方法往往难以解决由建筑物和树木造成的遮挡问题,它们只能提取粗略的道路级网络。近年来,已经见证了基于车载传感器方法的出现(见图1),这代表着车道拓扑推理领域的最新进展。

1|高精(HD)建图的车道拓扑推理图示

这些方法利用了深度学习架构,它们通常由几个关键组件组成:用于特征提取的主干网络(例如ResNet或者Swin Transformer)、用于鸟瞰图转换的透视变换、车道中心线检测和拓扑推理模块。现代方法通常结合多种输入模态,包括相机、激光雷达和现有的SD地图,以提高性能。基于transformer的架构和图神经网络(GNNs)的引入进一步推动了该领域的发展,实现了更复杂的拓扑推理能力。

现有的研究详细介绍了高精地图创建和车道拓扑构建,但是它们缺乏对最新研究的系统性介绍。本篇综述全面回顾了车道拓扑推理方法,分析了它们的演变、能力和局限性。本文研究了该领域中使用的不同评估指标,包括道路级指标和车道级指标,并且比较了各种方法在标准基准上的性能。此外,本文还讨论了当前的挑战,并且确定了未来研究中有前景的方向,旨在为研究者和从业者提供对这一快速发展领域的宝贵见解。

3、方法回顾

本节回顾了2024年之前发表的具有代表性的车道拓扑推理方法。如图2所示,这些方法根据其发展范式分为三类。

图2|2001年至2024年车道拓扑推理研究的演变,展示了该领域的方法进展和技术转型。时间线跟踪了三种不同的方法:基于程序化建模的方法(蓝色箭头)、基于航拍图像的方法(绿色箭头)和基于车载传感器的方法(橙色箭头)
 

程序化建模在2017年之前就已经盛行,基于航拍图像的方法在2017年至2022年期间获得了主流地位。自2023年以来,基于车载传感器的解决方案变得越来越普遍。

3.1 基于程序化建模的方法


车道拓扑推理的早期探索主要采用计算机建模技术来模拟城市道路网络,其主要优点是数据放大能力强。这些方法的工作流程如图4所示。

4|基于程序化建模方法的流程

在输入城市的2D图像地图(例如地理地图和统计地图)后,这些方法生成了包含建筑物、道路网络和其它城市特征的虚拟城市地图。交互式参数调整使得用户能够根据特定要求来优化结果。

Parish等人提出了将L-system应用于生成城市道路网络的开创性工作,这一概念在后续研究中得到了进一步扩展。Chen等人引入了张量场表示来建模道路几何形状。随后的改进引入了额外的约束和功能。地形感知方法确保了地理一致性,而智能仿真技术增强了交通建模的真实性。此外,基于草图的方法实现了直观的用户交互,示例驱动的方法利用预先存在的数据来加快道路网络生成。

3.2 基于航拍图像的方法

尽管基于程序化建模的方法是该领域的基础,但是这些方法的可控性仍然有限,并且严重依赖于人工设计的规则。此外,评估这些规则和参数对最终输出的影响本身具有挑战性,这需要大量的迭代实验来获得令人满意的结果。因此,这些方法缺乏灵活性。相比之下,深度学习的兴起通过从航拍图像中直接提取道路拓扑结构,从而彻底改变了高精建图技术。这些方法利用了神经网络,这最大限度地减少了人工干预,并且简化了建图过程。这些方法的一般工作流程如图5所示。

 图5|基于航拍图像方法的流程 

一些方法利用语义分割网络来识别航拍图像中的道路区域,然后进行形态学后处理以提取道路拓扑。替代方法包括迭代图构造和图生长方法。迭代图构造方法通过从道路网络中识别几个顶点,并且根据预定义的决策函数迭代地添加新的顶点和边来逐步扩展图。相比之下,图生成方法更为直接。这些方法采用矢量场编码策略,它们首先将航拍图像编码为潜在表示。神经网络随后用于预测图顶点,然后解码过程预测邻接矩阵并且重建道路网络。

3.3 基于车载传感器的方法

尽管基于航拍图像的方法为该领域引入了新的方法,但是它们仅限于提取粗略的道路级网络。此外,建筑物和树木造成的遮挡往往会使道路在航拍图像中不完整,从而影响结果的准确性。因此,这些方法不适合自动构建高精地图或者为自动驾驶汽车规划行为。为了解决这些局限性,基于车载传感器的方法逐渐兴起,它们利用从车载传感器捕获的单模态或者多模态数据来构建自车周围的详细车道拓扑。这些方法代表了高精建图的重大转变,它们提供了更高的准确性和适用性。图6展示了基于车载传感器方法的典型流程,包括主干网络、透视变换、车道解码器和拓扑解码器。

6|基于车载传感器方法的流程

主干部分通常由特征提取网络组成,例如ResNetSwin Transformer。然后,透视变换将这些特征转换为鸟瞰图(BEV)格式。在获得BEV特征后,通常使用基于transformer的架构来设计车道中心线解码器,以根据信息要求输出车道中心线特征。在这部分中,通常使用一组学习到的查询向量来映射不同的中心线实例。拓扑解码器的功能是在这些车道中心线实例之间建立连接,通常使用GNNsMLPs和语言模型。除了车载相机图像外,一些方法还使用补充数据源来增强输入特征,包括SD地图、激光雷达点云和交通元素(例如交通信号灯和交通标志牌),从而提高了性能。

Can等人提出了首批工作之一,他们使用来自前视相机的单帧图像作为输入并且采用类似于DETR的基于transformer的架构来预测中心线实例。该方法使用额外的MLPs来输出中心线实例的连接关系。同样,另一些方法也使用一组MLPs来预测拓扑关系。在先前工作的基础上,Can等人引入了最小环的概念,并且准确估计了交叉路口区域的车道连接关系。LaneGAP通过采用Path2Graph算法来恢复拓扑关系,从而进一步改进了拓扑估计。HDMapGen仅使用基于图的模型来自回归地生成车道拓扑。一些解决方案首先检测车道中心线,并且将每条车道中心线映射到顶点,然后使用基于图的模型来更新车道拓扑。此外,另一些方法对车道中心线特征进行序列化,并且使用语言模型来建立拓扑关系。

3.4 其它方法

尽管本项调研着重于上述三种方法类型,但是也存在其它重要的方法。例如,Jia等人根据现有高精地图中的车道线和道路边界来生成车道拓扑;He等人和Stanojevic等人从GPS轨迹中提取车道拓扑。

4、数据集和基准

本节列出了上述方法中常用的数据集。此外,本文还研究了该领域中使用的不同评估指标,并且比较了各种方法在基准数据集上的性能。


4.1 数据集

相关数据集可以分为2D数据集和3D数据集。表格1总结了这些数据集,它们通过提供针对特定研究需求而设计的多样化且高质量的数据,在推进道路拓扑提取和车道拓扑推理方面发挥关键作用。

表格1|当前相关数据集的比较

12D数据集:为了从航拍图像中提取道路拓扑结构,已经使用了几个2D数据集,包括SpaceNetDeepGlobeTopo-boundarySpaceNet是一个包含建筑和道路网络标注的大规模数据集,它广泛应用于城市拓扑提取任务。DeepGlobe专注于具有不同土地覆盖类型的乡村地区,该数据集提供了高密度的道路网络标注,使其适用于需要在非城市环境中进行建图的任务。Topo-boundary是专门为离线拓扑道路边界检测而设计的。

23D数据集:nuScenesArgoverse2OpenLane-V2是基于车载传感器的方法中使用的重要数据集。nuScenesArgoverse2都由来自高分辨率车载传感器(包括相机和激光雷达)的数据组成。OpenLane-V2是专门为车道拓扑推理任务而设计的独特3D数据集,它分为两个子集:subset_Asubset_B,分别来自Argoverse2nuScenes。这些子集确保了全面覆盖与车道拓扑推理相关的场景。

4.2 评估指标

三个像素级指标(精度、召回率和F1评分)和两个拓扑级指标(APLS评分和TLTS评分)是基于航拍图像的方法中常用的道路级指标。此外,车道级指标(例如感知指标(DETl评分)和推理指标(TOPll评分))在基于车载传感器的方法中广泛应用于车道中心线之间的拓扑结构。基于程序化建模的方法缺乏一致的评估指标,因此这里不讨论它们。

4.3 比较结果

表格2展示了三种基于航拍图像的方法(基于分割、迭代图构建和图生长)在Topo-boundary数据集上的定量结果。

表格2|最先进的基于航拍图像的方法在Topo-boundary数据集上的性能比较

表格3展示了基于车载传感器的方法在OpenLane-V2数据集上的定量结果。

表格3|最先进的基于车载传感器的方法在OpenLane-V2数据集上的性能比较

5、挑战

尽管在高精建图的车道拓扑推理方面取得了重大进展,但是仍然存在若干项挑战有待解决:(1)专用于车道拓扑推理的数据集构建受到高成本的阻碍,这限制了大规模、高质量数据集的可用性。因此,需要更多的研究工作来开发针对车道拓扑推理的可获取且鲁棒的数据集。(2)尽管基于车载传感器的方法代表了最新技术,但是它们通常涉及具有大型参数规模的模型。这限制了它们在自动驾驶汽车或者边缘设备上的直接部署,这些设备具有严格的计算和能量限制。因此,开发能够实时构建高精地图的轻量级模型是至关重要的。(3)用于车道拓扑推理的路侧和车载相机数据融合仍然没有得到充分探索。与车载相机不同,路侧传感器(例如道路视频监控)为高精建图提供了一个互补的视角,缓解了周围车辆的遮挡问题,并且提高了准确性。然而,关于这一领域的研究文献有限,因此需要进一步研究。

6、总结

车道拓扑推理技术已经成为高精建图和自动驾驶应用中的关键组成部分,从早期的程序化建模阶段快速发展成现代的基于车载传感器的方法。本篇综述对这一进展进行了全面分析,突出了取得的重大进展,同时确定了未来研究中的挑战和机遇。现代技术在捕获复杂的车道拓扑方面展现出卓越的性能。各种数据源(包括相机图像、激光雷达点云和现有的SD地图)的集成进一步提高了这些系统的鲁棒性和准确性。然而,一些关键挑战依然存在。大规模、高质量数据集的可用性受限继续制约着模型的开发和验证。此外,当前架构的计算需求对资源受限环境中的实时应用提出了挑战。对于该领域中的未来研究,一个有前景的方向是通过采用路侧基础设施辅助的车辆感知技术来构建车道拓扑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/902686.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开源模型应用落地-语音合成-MegaTTS3-零样本克隆与多语言生成的突破

一、前言 在人工智能技术飞速发展的今天,文本转语音(TTS)技术正以前所未有的速度改变着人机交互的方式。近日,字节跳动与浙江大学联合推出了一款名为MegaTTS3 的开源TTS模型,再次刷新了行业对高质量语音合成的认知。作为一款轻量化设计的模型,MegaTTS3以仅0.45亿参数 的规…

Python爬虫实战:移动端逆向工具Fiddler经典案例

一、引言 在移动互联网迅猛发展的当下,移动端应用产生了海量的数据。对于开发者而言,获取这些数据对于市场调研、竞品分析、数据挖掘等工作具有重要意义。Fiddler 作为一款功能强大的 Web 调试代理工具,能够有效捕获、分析和修改移动端的网络请求,为开发者深入了解移动端网…

AutoGPT超详细教程

AutoGPT超详细教程 AutoGPT 是一个强大的AI代理管理平台,允许用户通过直观的界面构建、部署和自动化复杂工作流程。其核心是ForgeAgent,它管理代理逻辑、工具集成和任务执行,并通过文件存储抽象层安全访问文件。用户可通过CLI创建代理、运行…

【Python网络爬虫实战指南】从数据采集到反反爬策略

目录 前言技术背景与价值当前技术痛点解决方案概述目标读者说明 一、技术原理剖析核心概念图解核心作用讲解关键技术模块说明技术选型对比 二、实战演示环境配置要求核心代码实现案例1:静态页面抓取(电商价格)案例2:动态页面抓取&…

矩阵运营的限流问题本质上是平台与创作者之间的流量博弈

矩阵运营的限流问题本质上是平台与创作者之间的流量博弈,要系统性解决这一问题,需从技术规避、内容优化、运营策略三个维度构建防御体系。以下结合平台算法逻辑与实战案例,深度解析限流成因及破解之道: 一、技术层:突…

【分布式理论17】分布式调度3:分布式架构-从中央式调度到共享状态调度

文章目录 一、中央式调度器1. 核心思想2. 工作流程3. 优缺点4. **典型案例:Google Borg** 二、两级调度器1. **核心思想**2. **工作流程**3. 优缺点4. **典型案例:Hadoop YARN** 三、共享状态调度器1. **核心思想**2. **工作流程**3. 优缺点4. **典型案例…

QSPI flash xip模式运行

背景: 在做一个项目,调研p-sram当ram用在cadence qspi接口下是否正常,首先用qspi-flash xip模式验证控制器是否支持flash的xip模式。 一、更改步骤: 1.1首先配置链接脚本 默认链接脚本 OUTPUT_FORMAT("elf32-littlearm&q…

【C++】 —— 笔试刷题day_23

一、 打怪 题目解析 我们现在要去刷毛球怪,我的攻击和血量是h和a、毛球怪的攻击和血量是H和A; 我们和毛球怪的对决是轮流攻击(我们先手),当血量小于等于0时死亡; 现在我们要求在自己存活的条件下,最多能够杀死几只毛球…

对话模型和补全模型区别

对话模型和补全模型区别 什么是对话模型、补全模型 什么是 Completion 最基本地说,文本模型是一个经过训练的大型数学模型,旨在完成一项单一任务:预测下一个 token 或字符。这个过程被称为 completion,在您的旅程中您会经常遇到这个术语。 例如,当使用 completion 文本…

dirsearch 使用教程:详细指南与配置解析

dirsearch 是一款强大的开源命令行工具,用于对 Web 服务器进行目录和文件暴力破解。它通过扫描目标网站,尝试发现隐藏的目录、文件或潜在的敏感资源,广泛应用于渗透测试和安全审计。dirsearch 提供丰富的选项和灵活的配置文件支持&#xff0c…

跟着deepseek学golang--认识golang

文章目录 一、Golang核心优势1. 极简部署方式生产案例​​:依赖管理​​:容器实践​​: 2. 静态类型系统​​类型安全示例​​:性能优势​​:​​代码重构​​: 3. 语言级并发支持​​GMP调度模型实例​​&…

Web常见攻击方式及防御措施

一、常见Web攻击方式 1. 跨站脚本攻击(XSS) 攻击原理:攻击者向网页注入恶意脚本,在用户浏览器执行 存储型XSS:恶意脚本存储在服务器(如评论区) 反射型XSS:恶意脚本通过URL参数反射给用户 DOM型XSS&…

CGAL 网格内部生成随机点

文章目录 一、简介二、实现代码三、实现效果参考资料一、简介 这里实现一种基于点的射线法来判断一个点是否一个多面提的内部,通过不停的生成随机点,以达到我们想要的效果,思路其实相对简单,但是很实用。具体内容如下: 1. 首先,我们需要构建随机方向的射线(半无限射线)…

tigase源码学习杂记-组件化设计

前言 tigase官方号称高度抽象和组件化。这篇文章就记录一下我研究组件化的相关设计 概述 我的理解tigase高度组件化是所有的关键的功能的类,它都称之为组件,即只要继承于BasicComponent,它都可以成为组件,BasicComponent类实现…

【Redis】 Redis中常见的数据类型(二)

文章目录 前言一、 List 列表1. List 列表简介2.命令3. 阻塞版本命令4. 内部编码5. 使用场景 二、Set 集合1. Set简单介绍2. 普通命令3 . 集合间操作4. 内部编码5. 使用场景 三、Zset 有序集合1.Zset 有序集合简介2. 普通命令3. 集合间操作4. 内部编码5. 使用场景 结语 前言 在…

OpenAI为何觊觎Chrome?AI时代浏览器争夺战背后的深层逻辑

目录 引言:一场蓄谋已久的"蛇吞象"计划 一、Chrome:数字世界的"黄金入口" 1.1 用户规模对比:ChatGPT与Chrome的悬殊差距 1.2 Chrome的生态价值远超浏览器本身 二、OpenAI的"入口焦虑"与战略布局 2.1 AI时…

二分小专题

P1102 A-B 数对 P1102 A-B 数对 暴力枚举还是很好做的&#xff0c;直接上双层循环OK 二分思路:查找边界情况&#xff0c;找出最大下标和最小下标&#xff0c;两者相减1即为答案所求 废话不多说&#xff0c;上代码 //暴力O(n^3) 72pts // #include<bits/stdc.h> // usin…

java延迟map, 自定义延迟map, 过期清理map,map能力扩展。如何设置map数据过期,改造map适配数据过期

1. 功能&#xff1a; map 线程安全&#xff0c;能够对存入的数据设置过期&#xff0c;或者自定义删除 2. aliyun代码看到的一个对象正好符合上述需求 出处是aliyun sdk core jar包的一个类。感兴趣可以去下载下jar查看 下面是源码&#xff1a; package com.aliyuncs.policy.…

国芯思辰|可编程线性霍尔传感器AH820替换HAL825用于汽车涡轮增压

涡轮增压技术是提高发动机的进气能力的技术&#xff0c;霍尔传感器可以达到监测涡轮转速的作用。在涡轮增压器的轴上安装一个永磁体&#xff0c;当涡轮旋转时&#xff0c;永磁体也随之转动&#xff0c;产生周期性变化的磁场。霍尔传感器靠近永磁体安装&#xff0c;能够检测到磁…

(转)正则化等最优化方法介绍

参考&#xff1a; http://blog.csdn.net/pipisorry/article/details/52108040 附带 损失函数&#xff1b;经验风险&#xff1b;正则化&#xff1b;结构风险 损失函数&#xff08;loss function&#xff09;是用来估量你模型的预测值f(x)与真实值Y的不一致程度&#xff0c;它是…