VirtualPainting:新一代多传感器融合方案,大幅提升3D目标检测性能

论文标题:VirtualPainting: Addressing Sparsity with Virtual Points and Distance-Aware Data Augmentation for 3D Object Detection

论文作者:Sudip Dhakal, Dominic Carrillo, Deyuan Qu, Michael Nutt, Qing Yang, Song Fu

导读: 本文提出了一种新颖的方法,它利用图像生成LiDAR虚拟点,通过基于图像的分割网络提供的语义标签来增强这些虚拟点,从而克服点云的稀疏性问题,提高了对稀疏分布对象的检测能力,有效解决了自动驾驶领域的一大痛点。©️【深蓝AI】编译

1.问题引入

3D目标检测在增强自动驾驶汽车场景理解方面起着关键作用。近年来出现了许多3D目标检测方法,这些方法主要利用来自LiDAR和相机传感器的信息来感知周围环境,LiDAR提供具有低分辨率的形状和深度信息的点云,而相机捕获包含丰富的颜色和纹理的图像。

虽然近期基于多模态的3D目标检测取得了明显进步,但它们在处理稀疏点云数据的性能方面依然存在不足。有学者提出了点装饰融合方法试图解决这个问题,如PointPainting,这些方法用相机特征装饰LiDAR点。然而,对于那些缺少相应点云的对象,如远距离和遮挡对象,处理它们的效果仍然不理想。即使这些对象的相机特征有所保留,但如果缺乏关联的点云特征,它们也无法被有效地检测到。所以说,这些方法性能仍然会受到LiDAR点云数据稀疏性的限制,如图1所示。

在这里插入图片描述
图1|基于绘制方法的局限性。黄圈部分表示图像投影中缺少点云的区域,红框部分表示由于点云稀疏而导致的检测失败的例子。尽管在黄圈内有一些语义线索,但由于没有LiDAR点,这些语义线索无法与LiDAR数据融合。

为了处理LiDAR数据的稀疏性,一些方法采用了生成虚拟点的方法——通过在现有的LiDAR点周围引入「补充点」来增强稀疏点云。例如,MVP 通过使用距离最近的3D点生成虚拟点,以补充2D实例点的深度信息。类似地,SFD也会 基于深度补全网络创建虚拟点。这些虚拟点在增强远距离对象的几何表示方面发挥了重要作用(然而,现有的方法还无法充分将语义网络的语义输出与虚拟点结合)。将语义信息融入到增强的点云(包括原始和虚拟点)中,不仅丰富了数据集,而且提高了模型的整体鲁棒性。

目前的大多数融合方法主要集中在不同的融合阶段:

· 前融合,即在早期阶段合并LiDAR和相机数据;

· 特征融合,即通过特征融合来结合来自相机和LiDAR的特征;

· 后融合,即合并来自LiDAR和相机检测框架的输出候选或结果。

需要注意的是,这些方法对训练数据质量的关注度几乎为零。然而训练数据质量是影响目标检测模型质量中的一个关键因素,这些方法使用的数据集往往缺乏稀疏分布对象(如遮挡和远距离对象)。训练数据不足使得训练的模型鲁棒性差,在测试阶段无法有效地检测到远距离对象。因此,融合方法也面临着数据增强不充分的挑战。2D图像数据与3D LiDAR数据之间的差异也使得很难适应一些对后者有效的数据增强技术。

2.方案提出

为了解决这些问题,作者提出了一个“虚拟绘图”的方法。通过使用深补全网络PENET 生成虚拟点来解决LiDAR点云数据的稀疏性问题。这一方法的具体流程为:

首先生成补充的虚拟点,并将它们与原始点合并,从而生成增强的LiDAR点云数据集。然后,该增强数据集利用来自相机的特征,进行一个“绘制”过程。相机生成的特征是语义分数或每个像素的类别分数的形式。将增强的点云与每个像素的类别分数连接,以获得特征丰富的点云。在上述处理的过成中,模型不仅生成了更密集的点云,而且还可以无缝地将相机特征与点云相结合。深补全网络生成的虚拟点与相机特征相关联,这生成了更全面的数据表示。然而在某些情况下,相机特征缺乏对应的LiDAR传感器点,这就导致缺乏传感器点的这些相机特征不会被并入。

此外,作者还集成了一种称为距离感知的数据增强(DADA)的技术,来解决远距离对象训练样本不足和数据增强技术不充分的问题。在这一技术中,作者应用远距离偏移的办法,从最初密集观测的对象中生成稀疏的训练样本。考虑到现实世界场景中经常出现由于遮挡而导致的数据不完整的情况,本文还引入了随机性:选择性地删除部分内容以模拟这种遮挡。通过整合这些训练样本,本模型在测试阶段遇到稀疏分布的对象(如遮挡或远距离对象)时,能够表现出更强的鲁棒性。

3.方法介绍

图2中展示了“虚拟绘图”框架。为了解决LiDAR点云的稀疏性问题和稀疏对象的稀疏训练样本问题,作者提出了一种多模态检测器,通过一系列不同的数据增强过程来增强原始点云数据。

在这里插入图片描述
图2|虚拟绘图框架的概览。

如上所示,本方法包括五个不同的模块:

1)一个2D语义分割模块,负责计算每个像素的分割分数

2)一个基于图像的深补全网络“PENet”,生成LiDAR虚拟点云

3)虚拟绘图过程,使用语义分割分数绘制虚拟和原始LiDAR点

4)距离感知数据增强(DADA)组件,采用距离感知采样策略,主要从附近的密集对象中生成稀疏训练样本

5)一个3D检测器,用于得到最终的检测结果。

3.1 基于图像的语义网络

相机拍摄的2D图像在纹理、形状和颜色信息方面非常丰富。这种丰富性为点云提供了宝贵的互补信息,从而提升了3D检测的效果。要利用这种协同作用,可以采用语义分割网络生成像素级的语义标签。作者使用了BiSeNet2分割模型,以多视图图像为输入,并为前景实例和背景提供每个像素的分类标签。值得注意的是,这一模块是非常灵活的,可以融合各种语义分割网络以生成语义标签。

3.2 PENet用于生成虚拟点

附近对象在LiDAR扫描中的几何形状通常相对完整,而对于远距离对象则恰恰相反。此外,由于2D图像数据与3D LiDAR数据之间的固有差异,导致了数据增强技术的不足。适用于3D LiDAR数据的一些数据增强技术很难应用于多模态方法。这一障碍在很大程度上使得多模态方法通常低于单模态方法的性能。

为了解决这些问题,作者采用PENet将2D图像转换为3D虚拟点云。该转换操作统一了图像和原始点云的表示,使模型能够像处理原始点云数据一样处理图像;将深补全网络生成的虚拟点与原始点对齐,以创建增强的点云数据;这种方法既增强了稀疏对象的几何信息,又为图像和点云的统一表示建立了联系。

3.3 绘制虚拟点

目前的LiDAR点云绘制方法还没有充分利用将语义网络的语义输出与虚拟点关联的优势。将语义信息融入到增强的点云(包括原始点和虚拟点)中,不仅丰富了数据集,而且提高了模型的鲁棒性。将激光雷达扫描生成的原始点称为“原始点云”,将从深补全网络生成的点称为“虚拟点”。从一组原始点云开始,可以使用已知的投影将其转换为稀疏深度图,还有一个与对应的图像。通过同时将稀疏深度图和对应的图像作为输入提供给深补全网络,可以得到一个密集填充的深度图。使用已知投影,然后可以生成一组虚拟点。

虚拟绘图算法包含三个主要步骤。在第一阶段,利用从深补全网络得到的虚拟点,将它们与原始LiDAR点对齐,有效地生成一个包含N个点的增强的LiDAR点云。在第二阶段,如前所述,分割网络产生C个类别的分数。在第三阶段,增强的LiDAR点投影到图像上,并将与相应的像素坐标对应的分割分数附加到增强的LiDAR点上,从而创建绘制好的LiDAR点。这一转换过程涉及齐次变换,如算法1所示。

在这里插入图片描述
图3 |虚拟绘图算法。

3.4 距离感知的数据增强

如前所述,稀疏对象的几何信息缺失会严重影响模型的检测性能。为了克服这一挑战,作者通过从最初密集观测的近距离对象中生成训练样本,来增强模型对稀疏远距离对象几何的理解。尽管已经出现了一些方法来解决这一挑战,例如随机采样或最远点采样,但这些技术通常会导致激光雷达扫描的点云中出现不均匀的分布模式。基于这种情况,作者采用了一种采样策略,它同时考虑了激光雷达扫描机制和场景遮挡。并将点转换为球面坐标系,接着将它们量化为与激光雷达的角分辨率对齐的球面体素。在每个体素内,计算点之间的距离。如果点之间的距离非常接近,几乎可以忽略、且低于预定义的阈值,则选择计算这些点的平均值。这生成了一组样本点,它们的分布模式与真实扫描点非常相似,如图2所示。在训练过程中,需要将这些采样点和边界框信息并入训练样本中,以促进数据增强。这种增强技术有望解决远距离对象训练样本不足的问题。此外,作者还随机删除密集LiDAR点的一部分来模拟遮挡,来间接地解决训练期间遮挡样本稀缺的问题。

3.5 检测器

在最后阶段,3D检测器以绘制增强点云的形式作为输入。由于Backbones或其他组件没有改变,所以将绘制好的点云作为输入到任何3D检测器(如PointRCNN、VoxelNet、PVRCNN、PointPillars等),都可以直接获得最终检测结果。

4.实验结果

作者在KITTI和nuScenes数据集上评估了虚拟绘图方法,与其他单模态和多模态的3D目标检测方法进行了比较。结果表明,本方法在3D和鸟瞰图(BEV)检测基准测试上都取得了显著的提升。

在这里插入图片描述
图4|增强的LiDAR点云和原始LiDAR点云的对比图。

在这里插入图片描述
表1|KITTI测试集上的BEV检测基准的结果。

在这里插入图片描述
表2|基于虚拟绘图的模型与基于绘制的模型的比较。

在这里插入图片描述
表3|nuScenes测试集上的性能比较。

在这里插入图片描述
表4|不同的多模态和单模态框架的推理速度。

在这里插入图片描述
表5|分析KITTI测试集上不同组件的影响,使用40个召回位置的AP(平均精度)指标计算行人和自行车类别的结果。

在这里插入图片描述
表6|nuScenes数据集上的消融研究。

在这里插入图片描述
图5|不同检测距离(KITTI测试集)上的性能提升和自行车类别的3D AP。

在这里插入图片描述
图6| 不同检测距离(KITTI测试集)上的性能提升和行人类别的3D AP。

5.结论

本文提出了一种通用的3D目标检测方法,它利用LiDAR点云和相机图像的融合,来提升检测精度,尤其是对于稀疏分布的对象。通过联合使用LiDAR点云和相机图像,来解决LiDAR点云的稀疏性和数据增强不足的问题。使用深补全网络,生成虚拟点云,使LiDAR点云变得更加密集,并采用点绘制机制,将图像语义与增强的LiDAR点云相结合,从而提高了对由于LiDAR点稀疏性而常常被忽略的对象的检测精度。此外,作者设计了距离感知的数据增强技术,使模型对遮挡和远距离对象更具鲁棒性。实验结果表明,本方法可以显著提高检测精度,尤其是对远距离或遮挡对象的检测精度。

编译|Deep蓝同学

审核|Los

移步公众号【深蓝AI】,第一时间获取自动驾驶、人工智能与机器人行业最新最前沿论文和科技动态。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/695442.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

后端程序员入门react笔记——react的diff算法(三)

diffing算法 虚拟dom 我们知道,react里面操作的都是虚拟dom,最后经过render渲染为真正的dom,那么为什么要提出虚拟dom这个概念呢?其实就是将逻辑和视图区分开,react的虚拟dom,就相当于mvc的c,…

【自然语言处理】:实验5,司法阅读理解

清华大学驭风计划课程链接 学堂在线 - 精品在线课程学习平台 (xuetangx.com) 代码和报告均为本人自己实现(实验满分),只展示主要任务实验结果,如果需要详细的实验报告或者代码可以私聊博主 有任何疑问或者问题,也欢…

激光条纹中心线提取算法FPGA实现方案

1 概述 激光条纹中心线提取是3D线激光测量领域一个较为基础且重要的算法。目前,激光条纹中心线提取已有多种成熟的算法,有很多相关的博客和论文。 激光条纹中心线提取的真实意义在于工程化和产品化的实际应用,而很多算法目前只能用于学术研究…

五、分类算法 总结

代码: from sklearn.datasets import load_iris, fetch_20newsgroups from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.model_selection import train_test_split, GridSearchCV from sklearn.naive_bayes import MultinomialNB from s…

括号匹配(终极版)(典型栈的运用的题目,值得一看)

括号匹配时运用栈的一个典型例子,它是充分利用了栈先进后出的特性,在这之前,我们先来看一个简单的题目 括号匹配1 Description 输入一串带括号的表达式,判断输入的表达式是否合理。即判断括号是否匹配。为了简化题目&#xff0…

代码随想录KamaCoder46. 携带研究材料(第六期模拟笔试)

题目&#xff1a; 代码(首刷看解析 2024年2月22日&#xff09;&#xff1a; #include<vector> #include<iostream> using namespace std; int Pacakge(vector<int>& a,vector<int>& weights, vector<int>& values) {int M a[0];//…

ElasticSearch语法

Elasticsearch 概念 入门学习: Index索引>MySQL 里的表(table)建表、增删改查(查询需要花费的学习时间最多)用客户端去调用 ElasticSearch(3 种)语法:SQL、代码的方法(4 种语法) ES 相比于 MySQL&#xff0c;能够自动帮我们做分词&#xff0c;能够非常高效、灵活地查询内…

【快速上手QT】04-定时器Timer

先来个小示例 我们先简单的来触发一下定时器。 #include "Zhetu.h"#include <qdebug.h>void Zhetu::timerEvent(QTimerEvent* event) { //定时器触发函数qDebug() << "Hello world"; }Zhetu::Zhetu(QWidget *parent): QMainWindow(parent){t…

C#,数值计算,矩阵的乔莱斯基分解(Cholesky decomposition)算法与源代码

一、安德烈路易斯乔尔斯基 安德烈路易斯乔尔斯基出生于法国波尔多以北的查伦特斯海域的蒙古扬。他在波尔多参加了Lyce e&#xff0c;并于1892年11月14日获得学士学位的第一部分&#xff0c;于1893年7月24日获得第二部分。1895年10月15日&#xff0c;乔尔斯基进入莱科尔理工学院…

PhotoSweeper X mac版 v4.8.5 相似重复照片清理工具 兼容 M1/M2

PhotoSweeper X for Mac是一款Mac重复照片/相似照片清理工具&#xff01;PhotoSweeper可以帮你进行&#xff1a;重复相似照片/数码相片查找、对比和删除&#xff0c;轻松清理Mac上的重复图片&#xff0c;非常实用。 应用介绍 PhotoSweeper X for Mac是一款Mac重复照片/相似照片…

实战打靶集锦-025-HackInOS

文章目录 1. 主机发现2. 端口扫描3. 服务枚举4. 服务探查5. 提权5.1 枚举系统信息5.2 探索一下passwd5.3 枚举可执行文件5.4 查看capabilities位5.5 目录探索5.6 枚举定时任务5.7 Linpeas提权 靶机地址&#xff1a;https://download.vulnhub.com/hackinos/HackInOS.ova 1. 主机…

【图片公式识别】图片公式转Word与LaTeX文档:智能识别与转换

前言 嘿&#xff0c;大家好呀&#xff01;&#x1f44b; 谁都知道&#xff0c;写 Word 文档里的公式可不是一件简单的事情&#xff01;你辛辛苦苦在键盘上敲出的数学公式&#xff0c;结果随着 Word 版本的更新&#xff0c;竟然变成了一张图片&#xff01;&#x1f624; 这简直就…

板块一 Servlet编程:第八节 文件上传下载操作 来自【汤米尼克的JavaEE全套教程专栏】

板块一 Servlet编程&#xff1a;第八节 文件的上传下载操作 一、文件上传&#xff08;1&#xff09;前端内容&#xff08;2&#xff09;后端内容 二、文件下载&#xff08;1&#xff09;前端的超链接下载&#xff08;2&#xff09;后端下载 在之前的内容中我们终于结束了Servle…

qtday2作业

思维导图 使用手动连接&#xff0c;将登录框中的取消按钮使用qt4版本的连接到自定义的槽函数中&#xff0c;在自定义的槽函数中调用关闭函数 将登录按钮使用qt5版本的连接到自定义的槽函数中&#xff0c;在槽函数中判断ui界面上输入的账号是否为"admin"&#xff0c;…

Linux搭建FISCO BCOS的第一个区块链网络

一、前言 FISCO BCOS是由金融区块链合作联盟&#xff08;深圳&#xff09;与微众银行共同发起的开源区块链项目&#xff0c;支持多链多账本&#xff0c;满足金融行业复杂业务需求。本文将介绍如何在Ubuntu操作系统上使用Linux命令搭建FISCO BCOS的第一个区块链网络。 目录 一…

K8S部署Java项目(Springboot项目)pod状态:CrashLoopBackOff

天行健&#xff0c;君子以自强不息&#xff1b;地势坤&#xff0c;君子以厚德载物。 每个人都有惰性&#xff0c;但不断学习是好好生活的根本&#xff0c;共勉&#xff01; 文章均为学习整理笔记&#xff0c;分享记录为主&#xff0c;如有错误请指正&#xff0c;共同学习进步。…

昇腾ACL应用开发之模型转换ATC

一.前提条件 在前面的章节中我们已经安装了包含模型转换的套件包CANN-TOOLKIT&#xff0c;默认的安装路径会在/usr/local/Ascend里面&#xff0c;我们将该套件所需要的东西加入到环境变量中以便我们调用&#xff1a; 将source /usr/local/Ascend/ascend-toolkit/set_env.sh加入…

人为物累,心为形役

一、人是什么 你是你&#xff0c;他是他&#xff0c;我是我&#xff0c;有什么区别吗&#xff0c;直到自我发现我与你不同时&#xff0c;不同是什么&#xff0c;身体结构&#xff1f;人生经历&#xff1f;所拥有的一切&#xff1f;暂时搁置这些的话&#xff0c;抽离我们的意识…

[ai笔记11] 论ai韭菜的自我修养

欢迎来到文思源想的ai空间&#xff0c;这是技术老兵学习ai以及观点分享的第11篇内容&#xff01; 上班之后时间确实少了许多&#xff0c;但是最近也没闲着&#xff0c;关于ai的学习一直在探索两个部分&#xff0c;一个是看那本有名的书《这就是ChatGPT》&#xff0c;另外一个则…