NGM-SLAM:首创融合神经辐射场子图的3DGS-SLAM,问鼎SOTA!

论文标题:

NGM-SLAM: Gaussian Splatting SLAM with Radiance Field Submap

论文作者:

Mingrui Li, Jingwei Huang, Lei Sun Aaron, Xuxiang Tian, Tianchen Deng, Hongyu Wang

导读:

3DGS技术因其性能卓越而备受关注,3DGS-SLAM系统应运而生。然而,当前3DGS-SLAM系统通常在大场景表示、有效的闭环校正和场景泛化能力方面存在缺陷。为此,论文作者设计了NGM-SLAM,这是第一个利用神经辐射场子图用于渐进式场景表示的GS-SLAM系统,有效地结合了神经辐射场和3DGS的优势,实现了最先进的场景重建和跟踪性能。©️【深蓝AI】编译

1. 背景简介

长期以来,SLAM技术一直是机器人学与AR/VR领域的核心议题。密集SLAM系统因广泛的应用潜力而备受重视。传统密集SLAM系统利用体素、点云和TSDF等显式表示,在追踪方面表现出色,但受限于高保真建模、空缺填补及纹理细节的处理,其应用范围受到一定局限。神经隐式SLAM系统,基于NERF的隐式表示,显著增强了SLAM系统的感知能力,但依旧面临实时性、运行速度和内存需求的瓶颈。

近期,3DGS-SLAM系统在保持NERF-SLAM系统的建图精度同时,在渲染速度和精度上取得了突破,挑战了神经隐式 SLAM 在密集重建中的主导地位。然而,值得注意的是,与NERF相比,3DGS-SLAM系统依赖点云输入,在空缺填补能力上有所欠缺,且未充分利用神经网络的泛化能力。此外,它缺乏稳健的闭环检测机制,导致在大场景中累积漂移问题凸显,影响了地图的稳定性和准确性。

2. 方案提出

针对上述挑战,作者创新性地设计了融合神经子图与3DGS表示的SLAM体系。

首先,构建以神经辐射场为基础的子图与一个全局关键帧索引。当达到地图构建阈值时,基于前序子图作为先验,将会创建新的神经子图,并实施高斯渲染。随后,执行局部捆绑调整(BA),并在子图间实施融合策略及高斯体修剪。闭环一旦被识别,即刻启用实时由粗到细的闭环校正,通过调整对应锚框的地图姿态,并运用全局BA及高斯渲染损失函数,以最小的计算成本有效修正累积漂移。

实验结果表明,本方法在跟踪和建图方面实现了SOTA性能,并且可扩展到大规模场景。

在这里插入图片描述
▲图1|NGM-SLAM系统架构©️【深蓝AI】编译

3. 细节解析

图1展示了NGM-SLAM的系统架构。该系统包括跟踪和建图两个模块。在初始子图开始建立后,跟踪模块持续估计相机姿态并检测环路,同时将子图的关键帧传递给建图模块。建图模块首先构造神经子图,该神经子图也用作多尺度GS(高斯抛雪球)子图的先验,并在子图之间执行并行渲染。在子图内执行局部束缚调整(BA)以校正姿态和建图误差,一旦检测到闭环,就对所有锚框执行全局BA。最后,生成的GS地图被缝合在一起。

■3.1 先验神经子图渲染

考虑到3DGS-SLAM系统在泛化推理能力上的不足,本文引入了基于数据驱动的增量神经子图作为基础监督机制,来填补空白并增强地图表示。基于ORB特征点追踪,仅在当前帧提取特征,减少了与子图创建和空缺填充相关的漂移问题。通过设立局部与全局关键帧列表,优化了局部与全局BA流程,并在子图积累至预设关键帧阈值时新建局部子图。为优化地图融合并减少融合误差,借助DBOW模型评估关键帧间的共视关系,确保地图结构的稳定性。

■3.2 多尺度高斯子图渲染

利用神经子图提供的先验信息,采用一组各向异性3DGS分布来描绘场景,利用位置、不透明度、三阶球谐系数、3D尺度及四元数描述的3D旋转来丰富场景细节。通过多尺度渲染技术,解决了小高斯体渲染中的锯齿问题,通过不同分辨率下的高斯体聚合,提高了渲染质量,同时在保证渲染速度的前提下,通过射线引导的高斯体修剪策略进一步提升了精度与效率。

■3.3 高效子图融合策略

为适应大规模场景并有效管理内存资源,本文提出了一套高效的子图融合机制。场景被划分为多个局部子图,每个子图依据关键帧的空间位置进行定位。在每次局部BA后,地图的中心姿态得到更新,以确保子图间的良好对齐。为了避免子图边界处出现视觉上的重叠或缝隙,从每个子图的边缘剔除了多余的高斯体,从而减轻了拼接时可能出现的伪影现象。接下来,采用高斯聚合技术,将相邻子图边界的较小高斯体合并为更大的单元,以实现无缝过渡。这一系列操作确保了子图间的平滑拼接,即使在多次闭环校正和全局BA之后,也能维持地图的一致性和完整性,同时控制了内存占用的增长。

■3.4 闭环检测与全局优化

闭环检测是确保地图整体一致性的关键步骤。采用局部与全局相结合的策略,首先在每个子图内部进行局部BA,专注于局部关键帧的校正。对于全局一致性,利用词袋模型(BoW)来检测全局关键帧之间的关联性,一旦发现闭环条件满足,即启动一个由粗到精的全局调整流程。这一过程首先通过BA优化锚定子图的姿态,接着执行子图融合,以消除边界漂移。在此之后,保持锚定子图姿态固定,基于全局关键帧列表执行全局BA,进一步细化姿态调整,并再次进行子图融合,以最终完成闭环校正。通过在整个过程中整合射线采样,能够指导高斯体的生成与融合,进而利用高斯渲染损失进一步细化地图,确保了全局地图的一致性和准确性,同时保持了系统的实时性。

4. 实验

实验结果表明,与现有基于3DGS的SLAM方法相比,本方法在多个维度上实现了显著提升,不仅提高了跟踪和建图的精度,还优化了系统运行效率,特别是在处理大规模多房间序列时展现了其优越性能。

在这里插入图片描述
▲图2|展示了在Replica数据集房间序列上,单目与RGB-D重建技术的对比结果©️【深蓝AI】编译

在这里插入图片描述
▲图3|展示了在Replica数据集四个大型公寓序列上的重建结果,证明了本方法有效避免了灾难性遗忘,并且能够实现背景的合理填充及场景的广泛适应性©️【深蓝AI】编译

在这里插入图片描述
▲图4|在ScanNet数据集的大规模多房间序列上,本方法展现了其在累积误差校正方面,相较于传统基于高斯抛雪球的方法有着更优的表现©️【深蓝AI】编译

在这里插入图片描述
▲表1|在Replica数据集的8个小房间序列上,本方法在平均PSNR(dB)、SSIM、LPIPS、ATE(cm)、跟踪FPS、系统FPS和GPU使用情况等方面的表现©️【深蓝AI】编译

在这里插入图片描述
▲表2|在Replica数据集的5个大规模场景序列上,本方法在ATE RMSE(cm)性能方面的表现©️【深蓝AI】编译

在这里插入图片描述
▲表3|在ScanNet数据集的6个大规模场景序列上,本方法在ATE RMSE(cm)性能方面的表现©️【深蓝AI】编译

在这里插入图片描述
▲表4|在TUM RGB-D数据集上,本方法在ATE RMSE(cm)性能方面的表现©️【深蓝AI】编译

在这里插入图片描述
▲表5|在EuRoC数据集上,使用立体视觉相机输入时,本方法在ATE RMSE(cm)性能方面的表现©️【深蓝AI】编译

5. 总结

总的来说,作者提出的NGM-SLAM系统成功地将神经辐射场的表达力与3DGS的高效渲染能力相结合,通过创新性的子图管理和闭环检测策略,克服了大场景建图和实时性要求的挑战,并以其稳健的跟踪性能和监督精度,展现出广泛的应用前景,这无疑将开启一股融合NeRF与3DGS技术的SLAM系统研究新浪潮。

编译|Deep蓝同学

审核|Los

移步公众号【深蓝AI】,第一时间获取自动驾驶、人工智能与机器人行业最新最前沿论文和科技动态。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/12833.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

uniapp微信小程序通过萤石云接入海康摄像机

需求:在uniapp微信小程序上查看海康威视的摄像机监控视频和和操作摄像机拍摄方向 在萤石云接入海康摄像机设备,由于不同品牌设备在不同时间段接入方式可能不一致,具体接入方式查看官方文档或咨询官方客服。 海康摄像机官方客服热线&#xf…

stack、queue、priority_queue以及仿函数

我们上次对std中的list进行实现,今天我们要实现stack、queue、priority_queue以及仿函数。 目录 stack堆堆的框架构造函数push插入pop删除size()大小empty()判断空top()取栈顶的元素 queue队列队列框架问题: 这里我们为什么用deque? 插入删除取头数据取…

AI交互数字人赋能农业数字化、智能化推广营销

2024陵水荔枝文化节上“数字新农人”陵小荔身着黎族服饰、佩戴银器亮相开幕式现场,AI交互数字人生动地以互动式推介和歌舞等形式,带领宾客们了解陵水荔枝的发展历程、产业布局、未来愿景等。如今,越来越多农产品品牌通过3D虚拟数字人定制&…

最详细的提单知识总结 | 数字贸易综合服务平台 | 箱讯科技

在外贸交易中,国际物流是必不可少的一个步骤。国际物流掌控好,就等于把货物牢牢握在手心,不怕货财两空。 本期将向大家介绍正本提单、电放提单、海运单三种国际海运放货方式以及区分它们的方法。 超实用!外贸人赶紧收藏~ 正本提…

CTF例题:[SWPU2019]Web1(无列名注入)

网址:BUUCTF在线评测 搜索web1 启动靶机 点击链接进入题目 进入题目后发现有登录和注册接口,直接注册登录。 首先通过1进行测试,查看是否有注入点 出现报错,说明可能存在注入点 然后继续测试发现该服务器过滤了: or、…

vue(九) 生命周期 v3.0和v2.0对比,父子组件生命周期的执行顺序

文章目录 生命周期vue2.0生命周期1.图示2.生命周期解释说明3.代码示例 vue3.0生命周期1.图示2.生命周期解释说明3.代码示例 父子组件中生命周期执行顺序v.3和v2.0生命周期对比 生命周期 每个 Vue 组件实例在创建时都需要经历一系列的初始化步骤,比如设置好数据侦听…

怎么做私域?先来了解私域运营模式!

现在,很多企业都在做私域,但仍旧有很多人会问:我的私域到底要怎么做? 关于这个问题,不同产品无论在消费频次与客单价上,还是在决策链路的长度和复杂度上,都有巨大的差异,消费者需要…

如何使用AspectJ做切面,打印jar包中方法的执行日记

最近在工作中遇到一个redis缓存中的hash key莫名其妙被删除的问题,我们用了J2Cache,二级缓存用的是redis。hash key莫名其妙被删除又没有日志,就想到做一个切面在调用redis删除hash key的方法的时候,打印日志,并且把调…

高德、百度开车导航APP是怎么知道红绿灯倒计时的?

高德、百度开车导航APP之所以能够知道红绿灯的倒计时,这背后是一系列复杂的科技手段和数据分析的综合运用。从交管部门提供的数据,到导航软件自身通过大数据和算法进行的计算,每一个环节都为红绿灯倒计时的准确呈现提供了支撑。 首先&#xf…

白酒:低酒精度白酒的消费特点与市场前景

低酒精度白酒的消费特点与市场前景是酒类市场的一个重要话题。随着品质意识的提高和消费者口味的多样化,低酒精度白酒逐渐受到越来越多的关注。云仓酒庄豪迈白酒作为白酒的品牌之一,其消费特点和市场前景值得深入探讨。 首先,从消费特点来看…

基于YOLOv5的道路裂缝检测,加入一种基于内容引导注意力(CGA)的混合融合提升2个多点

💡💡💡本文主要内容:详细介绍道路裂缝检测整个过程,从数据集到训练模型到结果可视化分析。 💡💡💡通过加入一种基于内容引导注意力(CGA)的混合融合提升检测性能, 特征融合创新 | 一…

WS2812C是一款将控制电路和RGB芯片集成在一个5050元器件封装中的智能控制LED光源

一般说明 WS2812C是一款将控制电路和RGB芯片集成在一个5050元器件封装中的智能控制LED光源。内部包括智能数字端口数据锁存器和信号整形放大驱动电路。还包括一个精密的内部振荡器和一个 12V电压可编程恒流控制部分,有效保证像素点光源颜色高度一致。 …

决策规划仿真平台的搭建

以下内容笔记据来自于b站up主忠厚老实的老王,视频;链接如下: 自动驾驶决策规划算法第二章第一节 决策规划仿真平台搭建_哔哩哔哩_bilibili 使用到的软件有matlab、prescan、carsim以及visual stadio。 我电脑上软件的版本是matlab2022a&am…

2024.1IDEA 到2026年

链接:https://pan.baidu.com/s/1hjJEV5A5k1Z9JbPyBXywSw?pwd9g4i 提取码:9g4i解压之后,按照 操作说明.txt 操作; IntelliJ IDEA 2024.1 (Ultimate Edition) Build #IU-241.14494.240, built on March 28, 2024 Licensed to gurgles tumbles You have…

Python代码:二、多行输出

1、题目 将字符串 Hello World! 存储到变量str1中,再将字符串 Hello Nowcoder! 存储到变量str2中,再使用print语句将其打印出来(一行一个变量)。 2、代码 import sys str1 Hello World! str2 Hello Nowcoder! print (str1,st…

详细分清Session,Cookie和Token之间的区别,以及JWT是什么东西

Cookie Cookie是一种小型的文本文件,由网站在用户访问时存储在其计算机或移动设备上,Cookie主要用于跟踪、识别和存储有关用户的信息。 简单来说Cookie就是用来存储某些后端发送给前端的数据,例如我们登陆后,后端会返回一个登录…

C++ requires关键字简介

requires 是 C20 中引入的一个新关键字,用于在函数模板或类模板中声明所需的一组语义要求,它可以用来限制模板参数,类似于 typename 和 class 关键字。 requires关键字常与type_traits头文件下类型检查函数匹配使用,当requires后…

激光雷达技术:科技之眼,照亮前行

在科技与人文关怀的交响乐章中,一项名为“蝙蝠避障”使用了激光雷达技术原理及应用的创新成果,正悄然改变着视障朋友们的生活方式,为他们的日常出行铺设了一条充满希望的光明之路。今天,让我们一起深入探讨这项技术如何成为盲人出…

深化市场布局与产业链整合,三清互联以创新为公司发展赋能

近年来,我国大力发展现代化电力体系,并不断推进智能电网的发展,电力物联网作为支撑电力行业数字化发展的关键基础设施,迎来了快速发展黄金时期。作为电力物联网领域领先企业之一,三清互联凭借敏锐的市场洞察力和技术创…

探索软件测试中的创新测试方法:测试左移

软件测试中的测试左移方法 在当今竞争激烈的市场中,满足客户的期望和需求是所有公司在竞争中成为市场领导者的关键。这就是为什么越来越多的公司现在转向测试左移,并将其应用于产品开发过程。 在本文中,我们将从初学者的角度来介绍测试左移…