GS-SLAM论文阅读笔记--TAMBRIDGE

前言

本文提出了一个自己的分类方法,传统的视觉SLAM通常使用以帧为中心的跟踪方法,但是3DGS作为一种高效的地图表达方法好像更侧重于地图的创建。这两种方法都有各自的优缺点,但是如果能取长补短,互相结合,那么就会是一个不错的工作。本文就是这样描述的。我比较好奇,ORB-SLAM3与高斯融合最终能达到什么样的效果。
在这里插入图片描述


文章目录

  • 前言
  • 1.背景介绍
  • 2.关键内容
    • 2.1 即插即用的融合连接模块
    • 2.2 在线3DGS重建
    • 2.3总体流程
  • 3.文章贡献
  • 4.个人思考


1.背景介绍

  1. 三维高斯溅射(3DGS)对运动模糊和相机噪声的鲁棒性有限,实时性差,限制了其在机器人SLAM任务中的应用。经过分析,产生这些问题的主要原因是运动模糊视图的密度和基于噪声原始图像和渲染结果计算损失的密集姿态估计累积误差,增加了3DGS渲染收敛的难度。
  2. 以帧为中心、稀疏和有效的信息可以提高定位精度,但缺乏对整个场景的高层次理解。相反,以地图为中心的、密集的和全局的信息有助于构建全局一致的地图。因此,挑战的实质在于这两个方面的矛盾:高效而稀疏,密集而嘈杂。
  3. 真实传感器的随机噪声和不断增加的视角重叠是影响绘制收敛速度的两个主要障碍,尤其是在长时间机器人任务中。因此,利用以跟踪为中心的SLAM的局部最优姿态来提供稳健的初始估计。通过联合优化稀疏重投影和稠密渲染误差,有效降低了图像噪声的影响。

什么是tracking-centered 与 mapping-centered 方法?

优先考虑定位精度的方法被称为“tracking-centered”的方法,而那些专注于高保真映射的方法被称为“ mapping-centered ”的方法。最初,由于计算能力的限制,以跟踪为中心的方法成为研究的焦点,因为它们在定位方面具有高实时性、准确性和鲁棒性。然而,这些方法往往缺乏一致的场景理解能力。

随着计算能力的发展,mapping-centered的方法通过对场景表示的明智选择和处理逐渐解决了收敛问题。同时,这些范式的运行效率也在稳步提高。一个重要的进步是采用神经辐射场(NeRF),它利用隐式神经网络进行全局一致的表示,并结合光线投射三角测量进行高保真渲染和新颖的视图合成。然而,神经网络推理和密集的逐像素优化计算的大量计算需求挑战了基于nerf的SLAM方法在真实机器人场景中对传感器噪声和运动模糊的鲁棒性。
最近,3D高斯喷溅(3DGS)利用高斯原语,既可解释又可编辑,作为场景的全局一致表示。该方法通过高斯溅射实现了更快速、可微分的栅格化渲染,并生成了更高保真度的新视图。

2.关键内容

2.1 即插即用的融合连接模块

如下图所示的融合bridge过程由五个部分组成:

  1. 视点选择
  2. Tracking-centered Encoder
  3. 3DGS-centered Encoder
  4. Filter Gate
  5. 联合优化

这个过程的目的是最小化由视觉测程生成的稀疏点云与用于高斯飞溅的后端之间的差距,特别是具有选定视点的3DGS,以获得合适的稀疏姿态进行重建。

视点选择:包括通过筛选关键帧之间的共视性关系来选择有利的视点进行渲染。两帧之间的共视性应在一个封闭的间隔内,平衡足够的匹配点以计算重投影误差,并保持视点之间足够的多样性。
在这里插入图片描述其中Ri表示是否选择当前关键帧i进行重构(1表示是,0表示否)。 M i − 1 M_{i−1} Mi1,i对匹配的特征点进行计数。 M i − 1 M_{i−1} Mi1,i是前一个关键帧中的匹配总数,它与α一起设置了最大匹配的百分比阈值,而β指定了选择所需的最小匹配。(这是一个简单的判断关键帧公式情况,也相当于优化了一下关键帧选择策略吧)。

Tracking-centered Encoder:对视觉里程计生成的稀疏点云进行编码,增强基于鲁棒特征的跟踪姿态的锚定效果。通过从渲染帧的局部地图中重新投影可见地图点。

3DGS-centered Encoder:对用于高斯飞溅的3DGS进行编码,其中局部仿射变换将这些各向同性(注意,作者也采用了各向同性,就是球不是椭圆)的3D高斯投影到相机平面上,然后使用alpha-blending算法渲染颜色和深度图像,得到渲染损失 L r g b L_{rgb} Lrgb L d e p t h L_{depth} Ldepth。此外,根据高斯的不透明度信息计算反映渲染像素p的不确定性的边界掩码 M b ( p ) M_b(p) Mb(p),如下所示:
在这里插入图片描述

Filter Gate:在优化过程中消除噪声。作者分为两个部分,深度门从点云和高斯分布中滤除深度异常。边界门根据边界蒙版过滤掉具有高不确定性的渲染像素:
在这里插入图片描述
其中G§表示是否选择当前像素p进行优化(1表示是,0表示否)。 D c ( p ) D_c(p) Dc(p) D g ( p ) D_g(p) Dg(p)为云点深度,像素p处的高斯分布。γ为p的最小边界掩模值的阈值。

联合优化:采用基于深度和颜色的渲染误差和基于特征坐标的重投影误差交替优化:
在这里插入图片描述
其中,L表示集合损失,包括点云特征的重投影损失 L r p j L_{rpj} Lrpj、高斯颜色Lc的渲染损失和深度Ld。系数w1、w2和w3分别表示这三种损失的权值超参数。

2.2 在线3DGS重建

在线3DGS重建方法使用稀疏帧和通过Fusion Bridge模块过滤的边界蒙版实现近实时重建。目前,基于3DGS的SLAM通常采用增量致密化,将当前帧中的未重构像素初始化为新的3DGS,这标志着在线和离线3DGS的关键区别。
致密化:边界蒙版之外的像素重构不足,缺乏稳健的高斯表示,需要进行致密化。在第一帧期间,从该帧中选择所有像素进行重建。在重建过程中,在像素平面上以一个像素长度的半径添加新的高斯函数,如式8所示,其中f表示焦距。
在这里插入图片描述
高斯修剪:更新高斯参数后,不透明度低于零或过高的高斯值在渲染过程中被移除,因为它们被认为是冗余或对重建没有贡献:
在这里插入图片描述
其中 P ( p ) P(p) P(p)表示像素P是否被修剪(1表示是,0表示否),τ为不透明度阈值。

2.3总体流程

该工作的前端使用以跟踪为中心的前端模块获得初始姿态估计,并使用ORB视觉里程计模块计算关键帧序列,类似于ORB- slam3。并且通过全局优化模块通过局部建图和闭环后的全局BA来优化最终轨迹。即插即用融合融合连接模块利用共可视性从关键帧序列中进一步选择重建帧,并通过最小化重新投影误差和颜色深度渲染误差,共同优化渲染位姿和边界蒙版。在线3DGS后端模块使用重构帧和边界蒙版的位姿,几乎实时地构建高保真,全局一致的高斯场景表示。
在这里插入图片描述

3.文章贡献

  1. 强调了精确的姿态初始化和好的视点选择对促进在线3DGS的收敛,特别是在大场景任务中的意义。
  2. 引入了即插即用的Fusion Bridge模块,将以跟踪为中心的SLAM前端与以在线3dgs为中心的后端无缝集成。

4.个人思考

  1. 这篇文章并没有提出新的东西,前端讲解了部分ORB-SLAM流程,在建图部分也只是把高斯的流程讲解了一边。
  2. 本文的创新在于设计了一个即插即用的Fusion Bridge模块,但我阅读完整篇文章,我觉得这个创新大部分是对阈值进行一些简单的调整,有些过于简单了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/54508.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

6.7泊松噪声

基础概念 在OpenCV联合C中给一张图片添加泊松噪声(Poisson Noise)可以通过生成随机数并在图像的每个像素上加上这些随机数来实现。泊松噪声是一种统计分布服从泊松分布的噪声,通常用于模拟光子计数等场景。 使用泊松噪声的场景 泊松噪声通…

【解决】chrome 谷歌浏览器,鼠标点击任何区域都是 Input 输入框的状态,能看到输入的光标

chrome 谷歌浏览器,鼠标点击任何区域都是 Input 输入框的状态,能看到输入的光标 今天打开电脑的时候,网页中任何文本的地方,只要鼠标点击,就会出现一个输入的光标,无论在哪个站点哪个页面都是如此。 我知道…

CQRS模型解析

简介 CQRS中文意思为命令于查询职责分离,我们可以将其了解成读写分离的思想。分为两个部分 业务侧和数据侧,业务侧主要执行的就是数据的写操作,而数据侧主要执行的就是数据的读操作。当然两侧的数据库可以是不同的。目前最为常用的CQRS思想方…

C++调用C# DLL之踩坑记录

C是非托管代码,C#则是托管代码,无法直接调用 CLR的介绍见CLR简介 MSDN提到了两种非托管-托管的交互技术:CLR Interop和COM Interop 后者要将C# 类库注册为COM组件,本文只探讨CLR,要通过C CLR写中间层代码 方式一&…

获取参数

获取querystring参数 querystring 指的是URL中 ? 后面携带的参数,例如:http://127.0.0.1:9090/web?query杨超越。 获取请求的querystring参数的方法如下: 方法1: Query package main// querystringimport ("github.com/…

引领长期投资新篇章:价值增长与财务安全的双重保障

随着全球金融市场的不断演变,长期投资策略因其稳健性和对价值增长的显著推动作用而日益受到投资者的重视。在这一背景下,Zeal Digital Shares(ZDS)项目以其创新的数字股票产品,为全球投资者提供了一个全新的长期投资平…

最优化理论与自动驾驶(十一):基于iLQR的自动驾驶轨迹跟踪算法(c++和python版本)

最优化理论与自动驾驶(四):iLQR原理、公式及代码演示 之前的章节我们介绍过,iLQR(迭代线性二次调节器)是一种用于求解非线性系统最优控制最优控制最优控制和规划问题的算法。本章节介绍采用iLQR算法对设定…

分析redis实现分布式锁的思路

文章目录 1、基于redis实现分布式锁:利用key的唯一性1.1、独占排他1.2、死锁问题1.2.1、redis客户端程序获取了锁之后,服务器立马宕机,就会导致死锁。1.2.2、不可重入:可重入 1.3、原子性:加锁和过期之间:s…

深入剖析Docker容器安全:挑战与应对策略

随着容器技术的广泛应用,Docker已成为现代应用开发和部署的核心工具。它通过轻量级虚拟化技术实现应用的隔离与封装,提高了资源利用率。然而,随着Docker的流行,其安全问题也成为关注焦点。容器化技术虽然提供了良好的资源隔离&…

4.C_数据结构_队列

概述 什么是队列: 队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点 相关名词: 队尾:写入数据的一段队头:读取数据的一段空队:队列中没有数据,队头指针 队尾指针满队&#…

FPGA与Matlab图像处理之直方图均衡化

文章目录 一、什么是直方图?二、什么是直方图均衡化?三、Matlab实现直方图均衡化的步骤第一步: 彩色图像转成灰度图像第二步:提取亮度通道的直方图第三步:累计亮度通道的像素值频率第四步: 映射到新的灰度值 四、Veri…

嵌入式 开发技巧和经验分享

文章目录 前言嵌入式 开发技巧和经验分享目录1.1嵌入式 系统的 定义1.2 嵌入式 操作系统的介绍1.3 嵌入式 开发环境1.4 编译工具链和优化1.5 嵌入式系统软件开发1.6 嵌入式SDK开发2.1选择移植的系统-FreeRtos2.2FreeRtos 移植步骤2.3 系统移植之中断处理2.4系统移植之内存管理2…

【java面经】Redis速记

目录 基本概念 string hash list set zset 常见问题及解决 缓存穿透 缓存击穿 缓存雪崩 Redis内存管理策略 noeviction allkeys-lru allkeys-random volatile-random volatile-ttl Redis持久化机制 RDB快照 AOF追加文件 Redis多线程特性 Redis应用场景 缓…

【医学半监督】置信度指导遮蔽学习的半监督医学图像分割

摘要: 半监督学习(Semi-supervised learning)旨在利用少数标记数据和多数未标记数据训练出高性能模型。现有方法大多采用预测任务机制,在一致性或伪标签的约束下获得精确的分割图,但该机制通常无法克服确认偏差。针对这一问题,本文提出了一种用于半监督医学图像分割的新…

【梯度下降|链式法则】卷积神经网络中的参数是如何传输和更新的?

【梯度下降|链式法则】卷积神经网络中的参数是如何传输和更新的? 【梯度下降|链式法则】卷积神经网络中的参数是如何传输和更新的? 文章目录 【梯度下降|链式法则】卷积神经网络中的参数是如何传输和更新的?1. 什么是梯度?2.梯度…

2024-04-23 人工智能增强天基通信和传感

砺道智库2024-04-23 11:18 北京 据国家防务网4月19日报道,随着商业卫星、军事星座及其所有数据在太空中流动的数量不断增加,政府和行业运营商表示,他们正在寻求人工智能来帮助他们处理日益复杂的任务。 人工智能软件使用户能够在轨道上改变航…

饲料颗粒机全套设备有哪些机器组成

饲料颗粒机全套设备通常包括原料粉碎、混合机、制粒机、冷却器、筛分机、包装机以及配套的电气控制等多个部分组成:1、粉碎机:将各种饲料原料进行清理、去杂、破碎等预处理,确保原料的纯净度和适宜粒度,为后续加工做准备。2、混合…

【永磁同步电机(PMSM)】 5. PMSM 的仿真模型

【永磁同步电机(PMSM)】 5. PMSM 的仿真模型 1. 基于 Simulink 的仿真模型1.1 PMSM 的数学模型1.2 Simulink 仿真模型1.3 模块封装(mask)1.4 三相PMSM矢量控制仿真模型 2. Simscape 的 PMSM 模块2.1 PMSM 模块的配置2.2 PMSM 模块…

数据结构与算法学习day22-回溯算法-分割回文串、复原IP地址、子集

一、分割回文串 1.题目 131. 分割回文串 - 力扣(LeetCode) 2.思路 分割回文串可以抽象为一棵树形结构。 递归用来纵向遍历,for循环用来横向遍历,切割线(就是图中的红线)切割到字符串的结尾位置&#xf…

WIFI路由器的套杆天线简谈

❝本次推文简单介绍下WIFI路由器的套杆天线。 路由器天线 路由器在这个万物互联的时代,想必大家对其都不陌生。随着科技的发展,常用的路由器上的天线也越来越多,那么问题来了:天线越多,信号越好吗?路由器…