A Survey and Framework of Cooperative Perception 论文阅读

论文链接

  • A Survey and Framework of Cooperative Perception: From Heterogeneous Singleton to Hierarchical Cooperation

0. Abstract

  • 首次提出统一的 CP(Cooperative Percepetion) 框架
  • 回顾了基于不同类型传感器的 CP 系统与分类
  • 对节点结构,传感模态和融合方法进行回顾
  • 提出了一个分层的 CP 框架,回顾现有的数据集和模拟器

1. Intro

目前的 CP 主要关注于自我车辆,对于可扩展的通用型 CP 框架仍然缺失。

从三个方面阐述

  • 节点结构
  • 传感器模态
  • 融合方案

同时提出了分层的 CP 框架


2. 架构与分类

SAE J3216 将 CDA 级别定义为五类,包括

  • 无协作自动化
  • A 类:状态共享
  • B 类:意图共享
  • C 类:协议寻求
  • D 类:规定性

2.1 架构

CP 过程的四个典型阶段:信息收集,边缘处理,云计算,消息分发

信息收集
安装在车辆或路边基础设施上的高分辨率传感器感知环境和收集交通信息,并通过通信集线器将收集到的数据传输到边缘服务器进行进一步处理

边缘处理
考虑到使用有限的带宽传输大量的原始数据(如点云数据)可能会导致不可接受的时间延迟(特别是在一些安全关键的场景中),从传感器收集的信息可能会在车辆或基础设施上的边缘服务器上处理。

对于单个的 感知结点(PN) 而言,处理感知数据主要由六个步骤:

  • 预处理:处理原始数据,为特定传感器的感知模块提供现成的格式
  • 特征提取:通过 DNN 或统计方法为后续的任务提取特征
  • 多传感器融合:单个 PN 使用多个传感器时,应该使用多传感器融合算法
  • 检测与跟踪:生成对象检测和跟踪结果,用于展示某些道路使用者的位置,姿态等
  • 原始数据记录:记录带有时间戳的原始传感数据过后期任务判断
  • 结果记录:记录语义感知数据和时间戳以供后期分析

对于不同的 PN,在 CP 系统中的任务也不同,如对于车辆感知结点(V-PN)而言,边缘处理主要用于本身,对于基础设施感知结点(I-PN)而言,其边缘处理是提高固定位置的姿态感知。

云计算
云计算充当多个PN的融合中心。来自异质PN的信息将通过不同的通信方式传输到云端,采用不同的融合方案进行数据融合,这取决于PN和云端之间要共享的数据类型。

对于异构的 PN 有三种类型的感知数据:

  • 原始信息:RGB 图像,点云信息等
  • 特征信息:通过神经网络或统计方法提取的隐藏特征,用于在高维空间中表示原始数据
  • 结果数据:包含2D/3D位置、大小、旋转等语义感知信息

由于带宽限制,结果数据是最常用的感知数据

信息分发
感知信息主要通过两种方式进行传递:1. 没有连接:TMC 等; 2. 有连接:访问定制信息
协同信息合一支持混合交通环境中更为复杂的协同操作

2.2 分类

CP 系统的三个关键方面:

  • 节点的多重性
  • 传感器模态
  • 融合方案

根据节点的多样性和传感器模态可进行以下分类:

  • 单点单模 CP(SS-CP):通过基础设施到所有设备(I2X)或车辆到所有设备(V2X)通信共享来自单模态传感器的感知数据
  • 多点单模 CP(MS-CP):通过I2X和/或V2X通信共享来自单模态多传感器的感知数据
  • 单点多模 CP(SM-CP):通过I2X或V2X通信共享多模态传感器感知数据
  • 多点多模 CP(MM-CP):通过I2X和/或V2X通信共享多模态传感器感知的感知数据


3. 节点结构

将节点定义为能够进行感知和通信的感知节点(PN),作为构建CP系统的基本单元,从节点结构的角度对CP进行讨论。

3.1 I-PN based CP (V2I)

Camera-based I-PN

  • 利用路边摄像机提出了一种基于卷积神经网络(CNN)的行人检测和定位方法
  • 基于单目相机的三维车辆检测方法
  • 车辆实时检测、跟踪和速度估计的监控系统
  • 基于深度学习的、通过路边摄像机自动检测路边停车位的方法
  • 利用多深度摄像机提出了一种协同的三维物体检测模型

LiDAR-based I-PN

  • 经典的PCD探测与跟踪流程:背景滤波,聚类,分类,跟踪
  • 基于学习的模型来处理激光雷达数据是另一种主要方法
3.2 Vehicle Nodes(V2V)
  • 车间的协同感知源于无人机的研究,如基于分布式和集中式的 CP 框架
  • 对于道路车辆:通过V2V通信将接收到的传感器数据关联起来
  • Kim等人实现了一种综合自动驾驶系统(ADS),该系统可以提供超越领先车辆遮挡的自我车辆信息
  • Cooper 和 F-Cooper
  • 进一步考虑通信的局限性,设计了“特征提取-压缩-解压-目标检测”流程
  • 基于特征共享的CP模型。空间定位和特征生成需要车辆相对于自车的姿态信息
3.3 Heterogeneous PN-based CP(V2X)
  • 该方向的研究目前较少
  • 通过 V 与 I 之间的合作
    • 通过PCD生成3D物体检测结果
    • 特征数据通过V2X通信共享
    • 提出一种基于多PN特征融合的网格特征方法
  • V2X-ViT:应用共享权重的 CNN 进行特征提取,车辆的姿态信息被传输到周围车辆和基础设施进行原始数据对齐
3.4 总结
  • V-PN:更具有自我效率
  • I-PN:更适合拓展合作
  • 同构 PN:扩展感知范围
  • 异构 PN:通过补充不同传感器配置,实现更好的 FOV

4. 传感器模态

4.1 配置与性能

目前的主流 ADS 设备是摄像头,LiDAR,雷达。对于路旁的传感器设置有典型的位置:信号臂和路灯柱,且对其最低的高度要求。每种传感器在不同的用例中都有自己的功能和优势:

  • 相机:高分辨率,但对于三维位置和速度测量来说不佳
  • 激光雷达:高精度3D感知,可适应环境变化。但价格相对较高,而且数据稀疏
  • 雷达:测量速度,但不太适合区分物体
  • 热成像相机:获取热信息,为照明变化提供弹性
  • 鱼眼相机:360度全视场(FOV)检测,但需要高精度的校准矩阵来解释失真
  • 环路:测量交通量和速度,安装和维护成本高
4.2 单传感器感知

基于单传感器的目标感知系统:

  • 从传感器收集的数据首先被预处理,以减少噪音,过滤不相关的数据,并为下游模块正确地重新格式化。
  • 应用特征提取,通过数学模型(如果基于传统方法)计算预定义的特征,或通过神经网络(如果基于深度学习)生成隐藏的特征
  • 感知模块生成目标检测和跟踪结果,送入后处理模块,以进一步清理感知输出(例如,过滤重叠的边界框和分数低于阈值的预测)。

4.3 多传感器感知

由于不同传感器的互补性,与基于单传感器的感知系统相比,基于多传感器的感知系统有可能通过传感器融合达到更好的目标检测和跟踪性能。
本节讨论了三种流行的基于高分辨率传感器的多传感器感知方案,即相机+相机,相机+激光雷达,以及激光雷达+激光雷达。

4.4 总结

摄像头擅长捕捉视觉信息,LiDAR在收集三维信息方面非常出色。在一个互补的计划中同时利用这些传感器的优势被认为是提高监控系统感知精度的一个有希望的解决方案。


5. 融合方案

从传感器融合的阶段来看,多传感器感知系统可以分为三类:

  • 早期融合–在预处理阶段融合原始数据
  • 深度融合–在特征提取阶段融合特征
  • 晚期融合–在后处理阶段融合感知结果
5.1 早期融合

与其他的 PN 之间共享原始数据,扩大了感知范围并同时提高精度。但对于原始数据的质量十分敏感。同时需要较大的通信带宽来传输大量的原始数据。在当前的通信能力之下,大规模的 V2V 项目利用早期融合是不可行的。

5.2 后期融合

融合独立的感知结果,对于误差校准和不同步的问题的包容度要远高于早期融合。

5.3 深度融合(中期融合)

使用提取的特征进行融合。目前深度融合仍处于起步阶段,需要后续的工作

5.4 总结

早期融合仅需要将多源数据对齐到统一坐标系中的校准,但需要较大的通信带宽来传输数据。后期融合主要关注如何合并多个感知管道生成的建议,思路简单,但准确性有限。由于其低通信要求和高精度的能力,深度融合正在迅速成为CP的一种可变革的解决方案。


6. 分层协同感知框架(HPC)

当前 CP 系统的三个主要问题:

  • 异构性:CP系统要结合智能汽车和智能基础设施的优势,赋能感知的全面性
  • 可扩展性:CP系统需要能够扩展到不同规模的合作层面,如交叉口层面、走廊层面、交通网络层面
  • 动态性:CP系统需要能够与车辆感知节点动态配合

本文的 HCP 框架主要针对路口场景,分为三个层次:交叉口级别;走廊级别以及网络级别

交叉口级别: V-PN 通信共享与车载数据处理,I-PN 感知结果作为辅助数据
走廊级别: 基于多个基础设施来扩展感知,核心是 I-PN。基于 I2I 的通信,共享原始数据和特征级数据
网络级别: 感知整个流量网络的对象级流量状况,使用后期融合策略


7. 数据集与模拟器

7.1 数据集
  • KITTI: 最受欢迎的数据集之一,由用于移动机器人和自动驾驶的各种传感器模式记录的数小时交通场景组成
  • NuScenes: 第一个搭载全自动车辆传感器套件的数据集:6 个摄像头、5 个雷达和 1 个 LiDAR,全部具有全 360 度视野
  • Waymo Open Dataset: 大规模、高质量、多样化的数据集,包含在一系列城市和郊区地理地形中捕获的 1150 个场景

2021年,Deng等人发布了BAAI-VANJEE路边数据集。支持互联自动车辆高速公路技术数据集由路边数据采集平台采集的LiDAR数据和RGB图像组成,包含2500帧LiDAR数据和5000帧RGB图像,其中包括12类物体、74K 3D物体注释和105K 2D物体注释

2022 年之前,没有可用的开源协作感知数据集来处理现实世界的数据

7.2 模拟器
  • CARLA: 一款用于自动驾驶的开源模拟器,支持灵活的传感器套件规格和环境条件
  • SVL: 一种用于驾驶自动化的高保真模拟器,它提供端到端和全栈模拟,可与多个开源自动驾驶堆栈(例如 Autoware 和 Apollo)连接
  • MavLink: 可以高频运行以进行实时硬件在环 (HIL) 仿真,并支持流行的协议

8. 讨论

8.1 现状与挑战
  • 异质性的感知单体:由于路边的传感器有更灵活的位置和姿势来获取数据,协同感知的一个典型方式是将信息从基础设施一侧传输给道路使用者。由于感知单体的异质性,最近只有少数研究考虑了车辆节点和路边设施节点之间的合作。
  • 传感器系统:在大多数研究中,摄像头和激光雷达传感器是分开工作的。另一方面,尽管路边设施在协同感知中起着关键作用,但目前基于路边传感器的感知方法在大多数情况下是直接应用一般的感知方法。主要挑战之一是路边数据采集和注释,以促进基于路边设施的感知系统的深度学习研究。
  • 融合策略的通用性:不同的融合方案有其特定的优势和劣势
8.2 未来趋势
  • 异质合作
    车辆与路边设施的合作是解决许多现有交通相关问题的一个有希望的方案。车辆-路边设施协同感知可以利用车辆(作为具有轻量级处理能力的移动感知节点)和基础设施(作为固定节点但具有强大的处理/存储单元)的能力来实现更好的性能。
  • 多模式的合作
    基于多传感器的感知系统有可能通过利用互补的传感器数据与适当的融合技术来提高感知性能。在照相机和LiDAR传感器的范围内,目前多模态传感器融合的发展主要是针对一个单一agent上配备的多个传感器的一般目标感知。 针对多个感知节点的特定多模态传感器融合仍是一个空白领域,然而,这也是提高整个系统感知精度的重要途径。
  • 可扩展的合作
    一些协同感知方法主要是为了在周围节点的协助下增强自车的感知能力,要求周围节点根据自车的元数据来调整它们分享的数据,当涉及众多车辆,这可能会导致可扩展性问题。基于路边设施的感知系统在传感器设备方面更加灵活,具有高计算边缘处理器、大数据存储和宽通信带宽。通过只在车辆上部署轻量级的车载计算模块,如特征图提取,实现基于局部深度融合的协同感知,或从基于路边设施的高性能节点检索感知结果,以实现更广泛的感知,这将变得更加经济有效。

9. 总结

  • 提出了架构和分类法,以说明协同感知系统的基本组成部分和核心内容。
  • 从节点结构、传感器模式和融合方案三个方面详细介绍了协同感知方法,并进行了文献复盘。
  • 提出的分层合作感知框架分别从交叉口、走廊和网络等不同层面进行分析。
  • 简要回顾了用于实现合作感知的现有数据集和模拟器,以确定其差距。
  • 讨论了当前的问题和未来的趋势。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/98295.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

lua 中文字符的判断简介

一般在工作中会遇到中文字符的判断、截断、打码等需求,之前一直没有总结,虽然网上资料也多,今天在这里简单的总结一下。 1 .UTF-8简单描述 UTF-8 是 Unicode 的实现方式之一,其对应关系(编码规则)如下表所…

【大数据】Apache NiFi 助力数据处理及分发

Apache NiFi 助力数据处理及分发 1.什么是 NiFi ?2.NiFi 的核心概念3.NiFi 的架构4.NiFi 的性能预期和特点5.NiFi 关键特性的高级概览 1.什么是 NiFi ? 简单的说,NiFi 就是为了解决不同系统间数据自动流通问题而建立的。虽然 dataflow 这个术…

【Linux】 rm命令使用

作为一个程序员 我们经常用到rm -rf * 或者rm -rf XXX 。但是rm -rf 是什么意思不是很清楚,咱们一起来学习一下吧。 rm(英文全拼:remove)命令用于删除一个文件或者目录。 rm 命令 -Linux手册页 著者 由保罗鲁宾、大卫麦肯齐、理…

Qt的WebEngineView加载网页时出现Error: WebGL is not supported

1.背景 当我在qml中使用WebEngineView加载一个网页时,出现以下错误: Error: WebGL is not supported 2.解决方案 其实这个问题在Qt的帮助文档中已经提及了解决办法: 因此,可以按照下面的步骤操作一下: 2.1.pro文件 …

Unity中Shader光强与环境色

文章目录 前言一、实现下图中的小球接受环境光照实现思路:1、在Pass中使用前向渲染模式2、使用系统变量 _LightColor0 获取场景中的主平行灯 二、返回环境中主环境光的rgb固定a(亮度),小球亮度还随之改变的原因三、获取Unity中的环境光的颜色1、Color模式…

练[SUCTF 2019]CheckIn

[SUCTF 2019]CheckIn 文章目录 [SUCTF 2019]CheckIn掌握知识解题思路关键paylaod 掌握知识 ​ .user.ini文件上传利用–需要上传目录有一个php文件(index.php)&#xff0c;文件头绕过&#xff0c;文件内容<&#xff1f;检测 解题思路 打开题目链接&#xff0c;发现又是一…

模块化编程+LCD1602调试工具——“51单片机”

各位CSDN的uu们你们好呀&#xff0c;小雅兰又来啦&#xff0c;刚刚学完静态数码管显示和动态数码管显示&#xff0c;感觉真不错呢&#xff0c;下面&#xff0c;小雅兰就要开始学习模块化编程以及LCD1602调试工具的知识了&#xff0c;让我们进入51单片机的世界吧&#xff01;&am…

Zabbix配置监控文件系统可用空间小于30GB自动告警

一、创建监控项 二、配置监控项 #输入名称–>键值点击选择 #找到磁盘容量点击 注&#xff1a; 1、vfs 该键值用于检测磁盘剩余空间&#xff0c;zabbix 内置了非常多的键值可以选着使用 2、单位B不需要修改&#xff0c;后期图表中单位和G拼接起来就是GB 3、更新时间 10S…

❋JQuery的快速入门2 jq鼠标滚轮

onmousewheelscript当鼠标滚轮正在被滚动时运行的脚本。 主要是利用top与left进行上下移动和左右移动 【使用获取的角度正值还是负值&#xff0c;判断是向上还是上下滚动】 $(element).on("mousewheel", function(event){var de event.originalEvent.deltaY; //需要…

基于springboot实现汽车租赁管理系统项目演示【项目源码+论文说明】分享

基于springboot实现汽车租赁管理系统项目演示 摘要 随着社会的发展&#xff0c;计算机的优势和普及使得汽车租赁系统的开发成为必需。汽车租赁系统主要是借助计算机&#xff0c;通过对汽车租赁信息等信息进行管理。减少管理员的工作&#xff0c;同时也方便广大用户对个人所需汽…

异常:找不到匹配的key exchange算法

目录 问题描述原因分析解决方案 问题描述 PC 操作系统&#xff1a;Windows 10 企业版 LTSC PC 异常软件&#xff1a;XshellPortable 4(Build 0127) PC 正常软件&#xff1a;PuTTY Release 0.74、MobaXterm_Personal_23.1 服务器操作系统&#xff1a;OpenEuler 22.03 (LTS-SP2)…

树的基本概念及二叉树

目录 一、树的基本概念 &#xff08;1&#xff09;树的结点 &#xff08;2&#xff09;度 &#xff08;3&#xff09;结点层次 &#xff08;4&#xff09;树的高度 树的特点&#xff1a; 二、二叉树 &#xff08;1&#xff09;满二叉树 &#xff08;2&#xff09;完…

JVM(八股文)

目录 一、JVM简介 二、JVM中的内存区域划分 三、JVM加载 1.类加载 1.1 加载 1.2 验证 1.3 准备 1.4 解析 1.5 初始 1.6 总结 2.双亲委派模型 四、JVM 垃圾回收&#xff08;GC&#xff09; 1.确认垃圾 1.1 引用计数 1.2 可达性分析&#xff08;Java 采用的方案&a…

Hudi 系列-基础概念-索引机制

目录 前言问题作用减少开销怎么理解数据变更基础 类型全局索引FlinkSpark 总结 前言 Hudi 系列文章在这个这里查看 https://github.com/leosanqing/big-data-study 索引(Index)是 Hudi 最重要的特性之一,也是区别于之前传统数仓 Hive 的重要特点, 是实现 Time Travel, Update…

抢先知:公抓抓 信息挖掘工具

随着经济全球化进程的加速&#xff0c;企业在不断发展和壮大&#xff0c;同时也在不断地适应市场的变化。在这个过程中&#xff0c;企业信息的及时获取和掌握变得至关重要。那么&#xff0c;最新企业信息哪里找呢&#xff1f;在这里介绍几个路径&#xff0c;可以参考&#xff0…

ARM:使用汇编完成三个灯流水亮灭

1.汇编源代码 .text .global _start _start: 设置GPIOF寄存器的时钟使能LDR R0,0X50000A28LDR R1,[R0]ORR R1,R1,#(0x1<<5)STR R1,[R0]设置GPIOE寄存器的时钟使能LDR R0,0X50000A28LDR R1,[R0] 从r0为起始地址的4字节数据取出放在R1ORR R1,R1,#(0x1<<4) 第4位设…

Visual Studio自定义模板参数、备注

模板路径&#xff1a; VS2022 x64&#xff1a;C:\Program Files\Microsoft Visual Studio\2022\Enterprise\Common7\IDE\ItemTemplatesVS2022 x86&#xff1a;C:\Program Files (x86)\Microsoft Visual Studio\2022\Enterprise\Common7\IDE\ItemTemplates 一、声明和启用模板…

4.方法操作实例变量 对象的行为

4.1 操作对象状态的方法 同一类型的每个对象能够有不同的方法行为&#xff0c;任一类的每个实例都带有相同的方法&#xff0c;但是方法可以根据实例变量的值来表现不同的行为。 play()会播放title值表示的歌曲&#xff0c;调用某个实例的play()可能会播放“Politik”而另一个会…

Zabbix自定义脚本监控MySQL数据库

一、MySQL数据库配置 1.1 创建Mysql数据库用户 [rootmysql ~]# mysql -uroot -p create user zabbix127.0.0.1 identified by 123456; flush privileges; 1.2 添加用户密码到mysql client的配置文件中 [rootmysql ~]# vim /etc/my.cnf.d/client.cnf [client] host127.0.0.1 u…

JMeter压测如何分配业务比例?

在进行综合场景压测时&#xff0c;由于不同的请求&#xff0c;要求所占比例不同&#xff0c;那如何实现呢&#xff1f; 有人说将这些请求分别放到单独的线程组下&#xff0c;然后将线程组的线程数按照比例进行配置&#xff0c;这种方法不是很好&#xff0c;想想&#xff0c;不…