性能拉满!NeRF与SLAM结合,最新SOTA参数减少30倍!

给大家推荐一个非常新兴的,有大量创新点可以挖掘的好方向:NeRF结合SLAM。

通过结合NeRF的高质量三维场景重建能力和SLAM的动态定位与环境理解能力,我们可以利用逐帧收集的数据,逐渐构建出高质量的3D场景模型,实现更加精确和细致的空间感知。

这种策略可以显著提高3D重建和定位系统的性能和质量,且无需预训练数据,更容易适应新的环境和场景。同时,为满足不同应用的需求,这种结合兼具灵活性和可扩展性,方便我们添加新的功能模块。

以神经隐式SLAM最新方法S3-SLAM为例: S3-SLAM,一种基于神经隐式表示的SLAM算法,通过稀疏化平面参数并整合三平面的正交特征,实现了快速且高质量的跟踪与映射。实验结果表明,S3-SLAM在参数数量减少30倍的情况下,达到了跟踪+重建全SOTA。

为方便想发论文的同学,本文整理了9种NeRF结合SLAM最新创新方案,可借鉴的创新点做了简单梳理,paper以及开源代码已附,具体工作细节可阅读原文。

论文原文以及开源代码需要的同学看文末

S3-SLAM: Sparse Tri-plane Encoding for Neural Implicit SLAM

方法:本文提出了稀疏三平面编码,它仅使用2~4%的常规三平面参数(从100MB减少到2~4MB),就可以高效地实现高达512分辨率的场景重建。在此基础上,本文设计了S3-SLAM,通过稀疏化平面参数并整合三平面的正交特征,实现了快速且高质量的跟踪与映射。此外,本文开发了分层捆绑调整,以实现全局一致的几何结构和高分辨率的外观重建。

创新点:

  • 提出了一种高效紧凑的稀疏三平面编码方法,用于解决神经隐式表示中参数数量和重建质量之间的权衡挑战。稀疏三平面编码通过使用哈希网格将正交平面特征稀疏化,显著减少模型内存消耗。

  • 开发了S3-SLAM,一种神经隐式SLAM方法,应用了稀疏三平面编码,实现了准确的相机位姿估计和场景重建,迭代次数较少。通过引入多分辨率稀疏三平面,仅需要原始三平面编码参数的2-4%就能表示复杂场景的高分辨率表示。

  • 设计了分层束调整(HBA)方法来优化局部外观和确保全局几何一致性,实现了高质量的外观重建和准确的位姿估计。

Photo-SLAM: Real-time Simultaneous Localization and Photorealistic Mapping for Monocular, Stereo, and RGB-D Cameras

方法:本文提出了一种称为Photo-SLAM的新型SLAM框架,用于同时定位和逼真地图。该系统利用显式的几何特征进行定位,并隐式捕捉场景的纹理信息。通过几何密集化和高斯金字塔学习的渐进式训练方法,进一步提高了地图的性能。

创新点:

  • SLAM中的闭环检测:闭环检测在SLAM中至关重要,它有助于解决在定位和几何映射过程中可能出现的累积误差和漂移问题。通过检测闭环,可以通过相似变换来纠正局部关键帧和超级基元。通过纠正相机姿态,可以进一步消除由里程漂移引起的幽灵现象,并提高映射质量。

  • 基于高斯金字塔的学习:引入了基于高斯金字塔的训练方法,通过逐步学习多级特征,增强了光线逼真的映射性能。

SNI-SLAM: Semantic Neural Implicit SLAM

方法:本文介绍了一种基于NeRF的稠密RGB-D语义SLAM系统SNI-SLAM。该系统通过实时建图实现准确的3D语义分割,并利用层次化语义编码来构建语义地图。同时,引入了特征损失来指导网络优化,在高层次上获得更好的场景优化结果。

创新点:

  • SNI-SLAM:基于神经隐式表示的语义SLAM系统,能够同时进行准确的语义建图、高质量的表面重建和稳健的相机跟踪。通过引入分层语义表示,实现自上而下的结构化语义建图,以实现多层次的语义理解。

  • 层次化语义建图:采用粗到细的语义建模方法,首先获得整体布局和主要对象的粗略理解,然后再对细节进行更精细的处理。

  • 特征融合:通过交叉注意力机制,将几何、外观和语义特征相互融合,实现特征的协同增强。这种融合策略利用了几何、外观和语义特征之间的互补性,从而生成更强大的特征表示。

SLAIM: Robust Dense Neural SLAM for Online Tracking and Mapping

方法:论文介绍了一种使用隐式地图来改进同时定位与地图构建(SLAM)的方法,以解决3D计算机视觉中的密集视觉SLAM问题。该方法通过在输出图像信号上应用高斯滤波器,扩大图像对齐优化和光度束调整的吸引区,从而使跟踪更加稳健和高效。该方法通过粗到精的策略来优化相机位姿和隐式场景表示。

创新点:

  • 引入了一种新的NeRF-SLAM流水线,通过使用高斯滤波器来改进图像对齐问题,从而实现了最先进的跟踪结果。这种方法通过扩大吸引域来优化图像对齐和光度束调整,使得跟踪更加健壮和高效。

  • 提出了SLAIM,一种使用隐式地图和粗到精的改进跟踪的稳健的NeRF-SLAM系统。该方法通过在射线终止分布上引入KL正则化器,在光线终止分布上实现了最佳和快速的收敛。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“神经结合”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/6995.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux migrate_type初步探索

1、基础知识 我们都知道Linux内存组织管理结构架构,顶层是struct pglist_data,然后再到struct zone,最后是struct page。大概的管理结构是这样的: 根据物理内存的地址范围可划分不同的zone,每个zone里的内存由buddy…

【企业动态】东胜物联正式加入EnOcean联盟,携手为智慧楼宇及能源管理提供更稳定的硬件解决方案

2024年4月,东胜物联(Dusun)宣布正式加入EnOcean联盟。EnOcean联盟是一个由来自建筑行业的400多家公司组成的全球性组织。它以EnOcean无线标准(ISO/IEC 14543-3-10/11)为基础,为可持续建筑自动化建立了创新的…

基于K8S构建Jenkins持续集成平台

文章目录 安装和配置NFSNFS简介NFS安装 在Kubernetes安装Jenkins-Master创建NFS client provisioner安装Jenkins-Master Jenkins与Kubernetes整合实现Jenkins与Kubernetes整合构建Jenkins-Slave自定义镜像 JenkinsKubernetesDocker完成微服务持续集成拉取代码,构建镜…

全栈低代码:前后端业务需求实现100%覆盖!

工具背景: 织信低代码平台“组件设计器”功能专为对个性化定制页面需求较为强烈的用户准备的,该功能组件十分丰富和强大,还融合了AI智能,能够帮助用户0成本起步,平均花1-2个小时就能快速构建一套网站、APP、小程序。 …

期权如何开户的流程是什么样的?

今天期权懂带你了解期权如何开户的流程是什么样的?期权账户开户是指投资者向期权经纪商或金融机构提交申请,以便可以在期权市场上进行交易并持有期权合约的账户开设过程。 期权如何开户的流程是什么样的? 1. 投资者参与营业部提供的股票期权…

Windows环境下VSCode C环境配置

前言: 本文记录了自己在配置 Windows环境下 VSCode C开发环境的遇到的问题和解决方法。 参考: vscode c语言没有代码提示_clangd提示不生效-CSDN博客 VSCODE无法跳转_vscode 不能跳转-CSDN博客 vscode c/c环境配置(MinGW)调用第三官方库…

【软件工程】测试

目录 前言软件测试的目标测试准则测试方法测试方案(重点)白盒测试(重点)逻辑覆盖测试语句覆盖判定覆盖(分支覆盖)条件覆盖判定/条件覆盖条件组合覆盖总结 基本路径覆盖法 黑盒测试等价类法边界值分析法 软件…

导数和偏导数练习

导数题目列表 偏导数题目列表 这里是上述50个导数和偏导数练习题的答案: 导数答案列表 偏导数答案列表 更多问题咨询 Cos机器人

Linux之命令行参数与环境变量

命令行参数&环境变量 命令行参数 main函数也是一个函数,其实也可以携带参数的 int main( int argc, char *argv[ ], char *envp[ ] ) {program-statements } 那这里是有三个参数的: 第一个参数: argc 是个整型变量,表示命令行参数的个数…

ABAP 第二代增强-采购申请子屏幕增强

文章目录 第二代增强-采购申请子屏幕增强需求实现过程创建项目运行效果客户屏幕的PBO全局变量获取数据更新数据运行效果查询底表修改数据 第二代增强-采购申请子屏幕增强 需求 实现过程 创建项目 运行效果 客户屏幕的PBO 全局变量 *&------------------------------------…

关于Docker的数据管理

文章目录 一、Docker的数据管理1、数据卷1.1 数据卷定义1.2 数据卷配置 2、数据卷容器2.1 创建数据卷容器2.2 使用--volume-from来挂载luck02 二、端口映射三、容器互联1、创建容器互联2、进入luck02测试(ping 容器名/别名) 四、Docker镜像的创建1、基于…

Java类文件.class详解

一、编译型语言和解释型语言的区别 1、编译型语言: 在编译型语言中,源代码会被整个编译成机器码或者中间代码(比如Java的字节码),生成可执行文件。 运行程序时,不需要再对源代码进行解释,而是…

RockChip Android13 NFC SL6320移植

环境:RK3568 Android13 一:驱动移植 1、驱动 将SL6320驱动代码拷贝至kernel-5.10/drivers/misc/sl6320/ 特殊说明:勿将驱动代码放置于kernel-5.10/drivers/nfc/目录下,会导致sl6320驱动生成设备节点时因/dev/nfc节点以创建而加载失败。 2、DTS 本次硬件设计电路走I2C协…

服务器数据恢复—多块磁盘离线导致阵列瘫痪,上层lun不可用的数据恢复案例

服务器存储数据恢复环境: 某品牌MSA2000存储,该存储中有一组由8块SAS硬盘(其中有一块热备盘)组建的RAID5阵列,raid5阵列上层划分了6个lun,均分配给HP-Unix小型机使用,主要数据为oracle数据库和O…

【LeetCode刷题】34. 在排序数组中查找元素的第一个和最后一个位置

1. 题目链接 34. 在排序数组中查找元素的第一个和最后一个位置 2. 题目描述 3. 解题方法 找到元素的第一个位置,也就是找大于等于目标的最小值找到元素的最后一个位置,也就是找小于等于目标的最大值可以利用2次二分查找来解决 3.1. 第一次查找 3.2. …

今日详解,教你如何不直播在视频号卖货

大家好,我是电商笨笨熊 视频号作为背靠微信的平台,从不需要考虑自身的流量问题, 因此在视频号推出之后就有大批的主播从其他平台转入视频号; 而这时候很多普通人应该也发现了新的机会,不再去内卷抖音、快手直播&…

【Git】Github创建远程仓库并与本地互联

创建仓库 点击生成新的仓库 创建成功后会生成一个这样的文件 拉取到本地 首先先确保本地安装了git 可以通过终端使用 git --version来查看是否安装好了git 如果显示了版本信息,说明已经安装好了git,这时候我们就可以进入我们想要clone到问目标文件夹 …

python-正则表达试-实践1

匹配html标签中的任意标签内数据 匹配所有包含’oo’的单词 import re text "JGood is a handsome boy, he is cool, clever, and so on..." re.findall(r\w*oo\w*, text) 匹配 html中title里面的内容 原文: import re file r./202304.html f open(…

2023数维杯A题原创完整论文思路和求解代码

河流对地下水有着直接地影响,当河流补给地下水时,河流一旦被污染,容易导致地下水以及紧依河流分布的傍河水源地将受到不同程度的污染,这将严重影响工农业的正常运作、社会经济的发展和饮水安全。在地下水污染中最难治理和危害最大的是有机污染,因而对有机污染物在河流-地下…

WordPress Automatic插件 SQL注入漏洞复现(CVE-2024-27956)

0x01 产品简介 WordPress Automatic(又称为WP Automatic)是一款流行的WordPress插件,旨在帮助网站管理员自动化内容创建和发布。该插件可以从各种来源(如RSS Feeds、社交媒体、视频网站、新闻网站等)获取内容,并将其自动发布到WordPress网站。 0x02 漏洞概述 WordPres…