近期两篇NeRF/3DGS-based SLAM方案赏析:TS-SLAM and MBA-SLAM

原文链接:近期两篇NeRF/3DGS-based SLAM方案赏析:TS-SLAM and MBA-SLAM

paper1:TS-SLAM: 基于轨迹平滑约束优化的神经辐射场SLAM方法

导读

本文提出了TS-SLAM,一种改进的基于神经辐射场(NeRF)的SLAM方法,通过引入轨迹平滑约束提高相机轨迹估计的准确性和重建地图的质量。该方法利用均匀三次B样条(B-splines)对相机轨迹进行建模,通过局部控制点优化确保轨迹的连续性和平滑性,并引入动态正则化约束相机的加速度和角加速度结合物理动力学先验进一步增强轨迹的物理合理性。系统设计了滑动窗口优化策略,对轨迹和地图分步调整,从局部到全局提升一致性。实验结果表明,TS-SLAM在TUM RGBD、ScanNet和NeuralRGBD数据集上相较现有方法显著提升了轨迹精度和重建质量,同时保持了较高的计算效率,展现出其在视觉SLAM领域的潜力。

论文信息

  • 标题:Optimizing NeRF-based SLAM with Trajectory Smoothness Constraints

  • 作者:Yicheng He, Guangcheng Chen, and Hong Zhang

  • 论文链接:https://arxiv.org/pdf/2410.08780

动机(Motivation)

本文的动机是解决当前基于神经辐射场(NeRF)的SLAM方法中相机轨迹估计存在的“跳跃性”和“非物理性”问题,这种问题不仅会降低轨迹的精度,还会对后续的地图重建质量产生不利影响。在现有方法中,相机轨迹的估计主要依赖隐式的地图表示约束,缺乏对轨迹平滑性和连续性的直接控制,从而导致局部轨迹不够自然且不利于实际应用(如导航和路径规划)。为此,本文提出通过引入轨迹平滑约束(基于B样条表示)和动态正则化来优化轨迹的平滑性和物理合理性,以提高相机定位的精度和重建的场景质量。

创新点

系统pipeline

系统pipeline

  1. 基于B样条的轨迹平滑约束

    • 引入均匀三次B样条(B-splines)表示相机轨迹,用控制点对轨迹进行建模。

    • 利用B样条的可微性和局部控制特性,实现轨迹的平滑性和连续性,避免传统方法中因隐式约束导致的轨迹跳跃问题。

  2. 动态正则化约束

    • 通过引入物理动力学先验,对相机轨迹的加速度和角加速度施加约束。

    • 这种正则化限制了轨迹中的非物理运动,确保轨迹符合实际动力学特性,从而生成更真实的轨迹。

  3. 滑动窗口局部调整策略

    • 设计了一种滑动窗口的局部捆绑调整(Local Bundle Adjustment)方法,在小范围内逐步优化控制点。

    • 通过粗到细的优化策略,稳定控制点的学习过程,并减少新增控制点对全局调整的负面影响。

  4. 结合全局优化的体系设计

    • 在局部优化的基础上,通过全局捆绑调整(Global Bundle Adjustment)对所有关键帧的控制点和地图进行联合优化,进一步提高轨迹和地图的一致性。

  5. 可拓展性和通用性

    • 该方法的轨迹平滑约束和正则化策略无需修改NeRF的场景表示和重建损失,因此可以无缝集成到现有的任何基于NeRF的SLAM系统中。

实验仿真结果

paper2:MBA-SLAM: 针对运动模糊的稠密视觉SLAM框架

导读

本文提出了MBA-SLAM(Motion Blur Aware SLAM),一种面向运动模糊场景的稠密视觉SLAM框架。通过引入运动模糊感知的跟踪器和基于辐射场(NeRF)或3D高斯分布(3DGS)的建图器,该方法能够在图像捕获期间建模摄像机运动轨迹,从而有效应对因运动模糊导致的定位和地图重建质量下降的问题。实验结果表明,MBA-SLAM在处理包含运动模糊的输入数据时,在摄像机定位和3D场景重建方面均超越了现有的最先进方法,同时对清晰数据也具有优秀的适应性。

论文信息

  • 标题:MBA-SLAM: Motion Blur Aware Dense Visual SLAM with Radiance Fields Representation

  • 作者:Peng Wang, Lingzhe Zhao, Yin Zhang, Shiyu Zhao, Peidong Liu†

  • 论文链接:https://arxiv.org/pdf/2411.08279

  • 项目地址:https://github.com/WU-CVGL/MBA-SLAM

动机(Motivation)

本文的动机在于解决现有稠密视觉SLAM方法在处理运动模糊图像时面临的性能下降问题。随着神经辐射场(NeRF)和3D高斯分布(3DGS)等新兴3D场景表示方法的广泛应用,SLAM系统在高质量输入数据上的表现得到了显著提升。然而,在实际场景中,摄像机经常因快速运动或低光照条件下的长曝光而产生运动模糊,导致:

  1. 定位准确性下降:传统SLAM依赖图像的光度一致性来估计摄像机位姿,而运动模糊破坏了这一假设,使得定位误差增加。

  2. 地图重建质量下降:多视角图像的特征匹配因运动模糊而变得不可靠,从而导致3D几何信息错误和地图重建的不一致性。

为了解决上述挑战,本文提出了一个运动模糊感知的SLAM框架,专门建模运动模糊的图像形成过程,同时结合NeRF或3DGS以实现高质量的3D场景表示和摄像机轨迹估计。此方法旨在提高SLAM系统在运动模糊输入下的鲁棒性和精度。

创新点

系统pipeline

系统pipeline

  1. 运动模糊感知的追踪器:提出了一种基于物理运动模糊图像形成模型的追踪器,通过建模图像曝光期间摄像机的运动轨迹,在定位阶段主动补偿运动模糊的影响。这显著提升了在运动模糊场景中的摄像机轨迹估计精度。

  2. 新型SLAM pipeline:整合了运动模糊感知的追踪器和辐射场(NeRF)或3D高斯分布(3DGS)为核心的建图模块,形成了一个鲁棒的、稠密的RGB-D SLAM管线,可以应对运动模糊和清晰图像的多样场景。

  3. 动态关键帧渲染与再模糊机制:在追踪过程中,从3D场景表示生成虚拟清晰图像,并通过摄像机运动轨迹对其再模糊以与输入图像匹配,从而增强光度一致性损失优化的鲁棒性。

  4. 广泛的实验验证:通过在合成和真实数据集上的实验,证明了该方法在运动模糊场景和清晰图像场景中的优越性能,超越了现有最先进的NeRF和3DGS SLAM方法。

  5. 高效实现:在NeRF实现中引入了基于三平面的高效表示,提高了训练效率;在3DGS实现中对高斯核的管理进行了优化,支持实时性能。

实验仿真结果

本文仅做学术分享,如有侵权,请联系删文!

👇👇👇👇👇👇👇👇👇👇

点击下方卡片

第一时间获取最热行业热点资讯,最新智驾机器人行业技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/61757.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

游戏引擎学习第20天

视频参考:https://www.bilibili.com/video/BV1VkBCYmExt 解释 off-by-one 错误 从演讲者的视角:对代码问题的剖析与修复过程 问题的起因 演讲者提到,他可能无意中在代码中造成了一个错误,这与“调试时间标记索引”有关。他发现了一个逻辑问题…

《鸿蒙系统:开启智能新时代的璀璨之星》

一、鸿蒙系统:崛起之路 鸿蒙系统的发展历程堪称一部科技创新的传奇。2012 年,华为前瞻性地启动鸿蒙系统研发项目,彼时或许很少有人能预见到它未来的辉煌。2019 年,鸿蒙系统首个开发者预览版的发布,如同夜空中的一颗璀…

SQL注入--DNSlog外带注入--理论

什么是DNSlog? DNS的作用是将域名解析为IP 而DNSlog就是存储在DNS服务器上的域名信息,它记录着用户对域名访问信息。可以理解为DNS服务器上的日志文件。 多级域名 比如blog.csdn.net,以点为分隔,从右向左依次是顶级域名、二级域名、三级域…

python: Serialize and Deserialize complex JSON using jsonpickle

# encoding: utf-8 # 版权所有 2024 ©涂聚文有限公司 # 许可信息查看:言語成了邀功盡責的功臣,還需要行爲每日來值班嗎 # Serialize and Deserialize complex JSON in Python # 描述:pip install jsonpickle https://github.com/jsonpi…

基于图的去中心化社会推荐过滤器

目录 原论文研究背景与研究意义概述论文所提出算法的主要贡献GDSRec算法原理与流程问题定义去中心化图(decentralized graph)所提出方法(三种并行建模)用户建模(user modelling) 模版代码讲解main.py顶层文件:用于集成…

计算机的错误计算(一百六十三)

摘要 四个算式“sin(0.00024/2)^2”、“(1-cos(0.00024))/2”、“(1-sqrt(1-sin(0.00024)^2))/2”以及“sin(0.00024)^2/(22*sqrt(1-sin(0.00024)^2))”是等价的。但是,在 MATLAB 中计算它们,输出不完全一致:中间两个算式的输出中含有错误数…

递归算法专题一>Pow(x, n)

题目&#xff1a; 解析&#xff1a; 代码&#xff1a; public double myPow(double x, int n) {return n < 0 ? 1.0 / pow(x,-n) : pow(x,n); }private double pow(double x, int n){if(n 0) return 1.0;double tmp pow(x,n / 2);return n % 2 0 ? tmp * tmp : tmp …

论文阅读 SimpleNet: A Simple Network for Image Anomaly Detection and Localization

SimpleNet: A Simple Network for Image Anomaly Detection and Localization 摘要&#xff1a; 该论文提出了一个简单且应用友好的网络&#xff08;称为 SimpleNet&#xff09;来检测和定位异常。SimpleNet 由四个组件组成&#xff1a;&#xff08;1&#xff09;一个预先训练的…

实战分享:如何在HP-UX上高效扩容Oracle 12c RAC ASM磁盘

文章目录 Oracle 12c RAC ASM磁盘扩容 for HP-UX一、扩容原因二、扩容前信息三、扩容详细步骤3.1 存储划分LUN&#xff0c;映射到Oracle 12c RAC相关主机组3.2 扫描查看磁盘3.3 检查两节点间的磁盘盘符是否一致3.4 以一个节点为准同步磁盘盘符3.5 更改磁盘属主、权限3.6 查看AS…

如何使用 Matlab 制作 GrabCAD 体素打印切片

本教程适用于已经对 Matlab 和 J750 操作有所了解的用户。 它不是有关如何使用 Matlab 软件或 PolyJet 打印机的全面课程。 Stratasys 为您提供以下内容&#xff1a; 第 1 步&#xff1a;什么是体素&#xff1f; 就像 2D 数字图像由像素组成一样&#xff0c;您可以将 3D 数字形…

CNN—LeNet:从0开始神经网络学习,实战MNIST和CIFAR10~

文章目录 前言一、CNN与LeNet介绍二、LeNet组成及其名词解释2.1 输入2.2 卷积层2.3池化层2.4 全连接层2.5 总结 三、MNIST实战3.1 构建神经网络3.2 数据处理3.3 &#xff08;模板&#xff09;设置优化器&#xff0c;损失函数&#xff0c;使用gpu(如果是N卡有cuda核心)&#xff…

SpringBoot集成Dynamo(3)集成远程dynamo

按照推荐的AWS IAM SSO模式&#xff0c;以文件存储凭证的方式&#xff0c;看下代码是如何访问的。 pom依赖&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"…

半导体、晶体管、集成电路、芯片、CPU、单片机、单片机最小系统、单片机开发板-概念串联辨析

下面概念定义从小到大串联&#xff1a; 半导体&#xff08;semiconductor&#xff09;&#xff1a; 是一类常温下导电性能介于导体与绝缘体之间的材料&#xff0c;这种材料的导电性可以随着外部环境比如电压、温度、光照的变换而改变。常见的半导体材料有硅、锗、砷化镓等。 晶…

学习路之phpstudy--安装mysql5.7后在my.ini文件中无法修改sql_mode

windows环境下使用phpstudy安装mysql5.7后需要修改mysql中的sql_mode配置&#xff0c;但是在phpstudy中打开mysql配置文件my.ini后&#xff0c; 通过查找找不到sql_mode或sql-mode&#xff0c; 此时无法在my.ini文件中直接进行修改&#xff0c;可以使用mysql命令进行修改&#…

了解大模型:开启智能科技的新篇章

在当今科技飞速发展的时代,人工智能(AI)已经成为推动社会进步的重要力量。而在AI的众多技术分支中,大模型(Large Model)以其强大的数据处理能力和卓越的性能,正逐渐成为研究和应用的热点。本文旨在科普大模型的基本概念、与大数据的关系以及与人工智能的紧密联系,帮助读…

多目标粒子群优化(Multi-Objective Particle Swarm Optimization, MOPSO)算法

概述 多目标粒子群优化&#xff08;MOPSO&#xff09; 是粒子群优化&#xff08;PSO&#xff09;的一种扩展&#xff0c;用于解决具有多个目标函数的优化问题。MOPSO的目标是找到一组非支配解&#xff08;Pareto最优解&#xff09;&#xff0c;这些解在不同目标之间达到平衡。…

联想ThinkServer服务器主要硬件驱动下载

联想ThinkServer服务器主要硬件驱动下载&#xff1a; 联想ThinkServer服务器主要硬件Windows Server驱动下载https://newsupport.lenovo.com.cn/commonProblemsDetail.html?noteid156404#D50

亚马逊搜索关键词怎么写?

在亚马逊这个全球领先的电子商务平台&#xff0c;如何让自己的产品被更多的消费者发现&#xff0c;是每一个卖家都需要深入思考的问题。而搜索关键词&#xff0c;作为连接卖家与买家的桥梁&#xff0c;其重要性不言而喻。那么&#xff0c;如何撰写有效的亚马逊搜索关键词呢&…

Flutter-Web首次加载时添加动画

前言 现在web上线后首次加载会很慢&#xff0c;要5秒以上&#xff0c;并且在加载的过程中界面是白屏。因此想在白屏的时候放一个加载动画 实现步骤 1.找到web/index.html文件 2.添加以下<style>标签内容到<head>标签中 <style>.loading {display: flex;…

动态规划子数组系列一>最长湍流子数组

1.题目&#xff1a; 解析&#xff1a; 代码&#xff1a; public int maxTurbulenceSize(int[] arr) {int n arr.length;int[] f new int[n];int[] g new int[n];for(int i 0; i < n; i)f[i] g[i] 1;int ret 1;for(int i 1; i < n-1; i,m. l.kmddsfsdafsd){int…