3D Gaussian Splatting 应用场景及最新进展【附10篇前沿论文和代码】

CV玩家们,知道3D高斯吗?对,就是计算机视觉最近的新宠,在几个月内席卷三维视觉和SLAM领域的3D高斯。不太了解也没关系,我今天就来和同学们一起聊聊这个话题。

3D Gaussian Splatting(3DGS)是用于实时辐射场渲染的 3D 高斯分布描述的一种光栅化技术,具有高质量和实时渲染的能力。如果说NeRF等辐射场方法彻底改变了多张照片或视频主导的场景新视角合成的算法生态,那么3D高斯则是在NeRF的基础上,做到了在保持有竞争力的训练时间的同时实现最先进的视觉质量。

不仅如此,我们都知道传统的NeRF渲染过于粗暴,且随机性较大,但基于3D Gaussian Splatting的渲染技术则全面展现出了更好的实时性,更好的渲染质量,以及更精确的定位精度。

因此,3D Gaussian Spaltting方向最近涌现了大量开创性的新工作,我在这里帮同学们简单的总结了一波,包括3D高斯的开山作,以及一些应用成果

论文原文及开源代码看文末

1.3D Gaussian Splatting for Real-Time Radiance Field Rendering

用于实时辐射场渲染的3D高斯溅射

「SIGGRAPH 2023 best paper,3D高斯开山作」

「简述:」Radiance Field方法是一种用于多张照片或视频场景的新视图合成技术。然而,目前的方法要么需要昂贵的神经网络进行训练和渲染,要么牺牲速度以换取质量。作者提出了三个关键元素来实现高质量的实时渲染:使用3D高斯表示场景,优化各向异性协方差以准确表示场景,并开发快速的可见性感知渲染算法。作者在多个数据集上展示了先进的视觉质量和实时渲染效果。

2.Segment Any 3D Gaussians

分割一切「3D高斯」版

「简述:」论文介绍了一种新的3D交互式分割方法——Segment Any 3D GAussians(SAGA),它无缝融合了基于2D分割的基础模型和最近在辐射场中取得突破的3D高斯散射(3DGS)。SAGA通过精心设计的对比训练将基础模型生成的多粒度2D分割结果高效地嵌入到3D高斯点特征中。在现有基准测试上进行的评估表明,SAGA可以与最先进的方法竞争。此外,SAGA可以实现多粒度分割并适应各种提示,包括点、涂鸦和2D掩码。值得注意的是,SAGA可以在几毫秒内完成3D分割,相对于先前的SOTA实现了近1000倍的加速。

3.Mip-Splatting: Alias-free 3D Gaussian Splatting

无别名的3D高斯溅射

「简述:」最近,3D高斯散射在新的视图合成方面取得了令人印象深刻的结果,达到了高保真度和高效率。然而,当改变采样率时(例如通过改变焦距或相机距离),会出现明显的伪影。作者发现这种现象的主要原因是缺乏3D频率约束和使用2D膨胀滤波器。为了解决这个问题,作者引入了一个3D平滑滤波器,根据输入视图引起的最大采样频率来限制3D高斯原语的大小,从而消除缩放时的高频伪影。此外,用模拟2D盒式滤波器的2D Mip滤波器替换2D膨胀滤波器有效地缓解了混叠和膨胀问题。评估包括在单个尺度的图像上进行训练并在多个尺度上进行测试等场景,验证了该方法的有效性。

4.Splatter Image: Ultra-Fast Single-View 3D Reconstruction

超快速单视图3D重建

「简述:」论文介绍了Splatter Image,一种超快速的单视图3D重建方法,运行速度为38 FPS。该方法基于高斯溅射,将输入图像映射为每个像素的一个3D高斯,生成的图像称为Splatter Image。该方法使用2D图像到图像网络进行学习,并在测试时只需要前向评估神经网络即可进行重建。我们还扩展了该方法以处理多个图像作为输入,并使用跨视图注意力来提高性能。在标准基准测试中,作者展示了快速重建和更好的结果,优于最近的更昂贵的基线。

5.PhysGaussian: Physics-Integrated 3D Gaussians for Generative Dynamics

用于生成动力学的物理集成3D高斯分布

「简述:」论文介绍了PhysGaussian,一种将基于物理的牛顿动力学无缝集成到3D高斯分布中的方法,以实现高质量的新运动合成。该方法使用自定义的物质点方法(MPM),通过连续力学原理对3D高斯核进行丰富的物理有意义的运动变形和机械应力属性。该方法的一个显著特征是物理模拟和视觉渲染之间的无缝集成:这两个组件都使用相同的3D高斯核作为它们的离散表示形式。这消除了三角形/四面体网格、Marching Cubes、“笼子网格”或其他任何几何嵌入的必要性,强调了“所见即所模拟(WS2)”的原则。该方法还展示了在各种材料上的出色通用性,包括弹性实体、金属、非牛顿流体和颗粒状材料,展示了其在创建具有新颖视角和运动的多样化视觉内容方面的强能力。

6.SuGaR: Surface-Aligned Gaussian Splatting for Efficient 3D Mesh Reconstruction

用于高效3D网格重建的表面对齐高斯溅射

「简述:」论文提出了一种从3D高斯溅射中快速提取网格的方法。该方法使用正则化项鼓励高斯与场景表面对齐,并使用泊松重建从高斯中提取网格。最后,引入了一种可选的细化策略,将高斯绑定到网格的表面,并通过高斯溅射渲染共同优化这些高斯和网格。该方法可以在几分钟内检索到可用于逼真渲染的可编辑网格,并提供更好的渲染质量。

7.Gaussian Splatting SLAM

高斯溅射SLAM

「简述:」论文介绍了一种将3D高斯散射应用于单目或RGB-D相机的增量式3D重建的方法。该方法使用高斯作为唯一的3D表示形式,实现了准确、高效跟踪、映射和高质量渲染所需的表示形式。通过直接优化针对3D高斯进行相机跟踪,并引入几何验证和正则化来处理歧义性,实现了快速和鲁棒的跟踪和重建。同时,该方法还实现了全面的SLAM系统,可以重建微小甚至透明的物体。

8.GaussianEditor: Swift and Controllable 3D Editing with Gaussian Splatting

使用高斯溅射实现快速和可控的3D编辑

「简述:」论文介绍了一种基于高斯散射的高效3D编辑算法——GaussianEditor。该算法通过高斯语义跟踪来增强编辑精度和控制性,并使用分层高斯散射来实现稳定和精细的结果。此外,作者还开发了用于对象删除和集成的编辑策略。实验表明,GaussianEditor具有优越的控制、效率和快速性能,是3D编辑领域的重要进展。

9.GSGEN: Text-to-3D using GaussianSplatting

使用高斯溅射进行文本到3D转换

「简述:」论文介绍了一种基于高斯溅射的文本到3D生成方法——GSGEN,用于生成高质量的3D对象。该方法利用了3D高斯散射表示来引入3D先验,并采用渐进式优化策略,包括几何优化和外观细化阶段。通过这些设计,作者的方法可以生成具有精致细节和更准确几何形状的3D内容。实验表明,该方法非常有效,尤其是在捕捉高频成分方面。

10.Dynamic 3D Gaussians: Tracking by Persistent Dynamic View Synthesis

动态3D高斯:通过持续动态视图合成进行跟踪

「简述:」论文介绍了一种同时解决动态场景新视图合成和所有密集场景元素的六自由度跟踪任务的方法。该方法使用3D高斯集合来模拟场景,并通过可微渲染优化来重建输入图像。为了模拟动态场景,允许高斯随时间移动和旋转,并强制它们具有持久的颜色、不透明度和大小。通过使用局部刚体约束对高斯的运动和旋转进行正则化,实现了密集的6-DOF跟踪和动态重建。该方法能够实现许多下游应用,如第一人称视角合成、动态组成场景合成和4D视频编辑。

 

关注下方《学姐带你玩AI》🚀🚀🚀

回复“3D高斯”获取论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/606157.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ShardingSphere-JDBC学习笔记

引言 开源产品的小故事 Sharding-JDBC是2015年开源的,早期的定位就是一个分布式数据库的中间件,而在它之前有一个MyCat的产品。MyCat也是从阿里开源出来的,作为分库分表的代名词火了很长一段时间,而MyCat早年的目标就是想进入ap…

一致性 Hash

一致性 Hash 一致性哈希算法(Consistent Hashing Algorithm)是一种分布式算法,常用于负载均衡。Memcached client 也选择这种算法,解决将 key-value 均匀分配到众多 Memcached server 上的问题。它可以取代传统的取模操作,解决了取模操作无法…

关于网盘下载速度提升的一些技巧!!

这里写自定义目录标题 前言:步骤:一、下载IDM二、安装油猴三、添加到Google拓展程序上PS:四、添加脚本五、IDM配置六、打开网页版网盘 前言: 18G的网盘资源下载时间仅仅3-5分钟 步骤: 一、下载IDM 这里我以IDM举例…

kettle分页抽取数据

背景 kettle抽取数据大家还是比较熟悉的,kettle在抽取数据的时候会开启很多通道,同时抽取,但是我现在遇到一个场景: 从一个mysql数据库里获取“已办”状态的数据id,然后拿这些id去一个oracle数据库里查询&#xff0c…

【MATLAB】ICEEMDAN_LSTM神经网络时序预测算法

有意向获取代码,请转文末观看代码获取方式~也可转原文链接获取~ 1 基本定义 ICEEMDAN-LSTM神经网络时序预测算法是一种结合了改进的完全扩展经验模态分解(ICEEMDAN)和长短期记忆神经网络(LSTM)的时间序列预测方法。 …

【UE Niagara学习笔记】02 - 制作燃烧的火焰

目录 效果 步骤 一、添加资产 二、制作材质 三、制作粒子 3.1 循环播放 3.2 粒子生成的数量 3.3 粒子的生命周期和初始大小 3.4 火焰高度 3.5 火焰范围 3.6 火焰颜色 效果 步骤 一、添加资产 1. 在虚幻商城中搜索“M5 VFX Vol2. Fire and Flames(Niagara)”…

遇见狂神说 Spring MVC 学习笔记(完整笔记+代码)

MVC架构介绍 MVC是模型(Model)、视图(View)、控制器(Controller)的简写,是一种软件设计规范MVC是将业务逻辑、数据、显示分离的方式来组织代码MVC主要作用是降低了视图与业务逻辑间的双向偶合MVC不是一种设计模式,是一种架构模式。当然不同的MVC存在差异…

python 文件

open """ def open(file: FileDescriptorOrPath, //路径mode: OpenTextMode "r", //设置打开文件的模式 r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 w 打开一个文件只用写入。如果该文件已存在则打开文件&#…

CodeWave智能开发平台--03--目标:应用创建--07供应商数据表格02

摘要 本文是网易数帆CodeWave智能开发平台系列的第10篇,主要介绍了基于CodeWave平台文档的新手入门进行学习,实现一个完整的应用,本文主要完成07供应商数据表格下 CodeWave智能开发平台的10次接触 CodeWave参考资源 网易数帆CodeWave开发…

Docker简述与基础部署详解

docker官网:https://www.docker.com docker中文库:https://www.docker.org.cn/ Docker是一种开源的容器化平台,用于轻松打包、交付和运行应用程序。Docker的主要优势在于它提供了一种轻量级、可移植、自包含的容器化技术,使得应用程序及其所…

智能手表喇叭无气孔导致老化播放后没声音

智能音箱喇叭老化播放后没声音 智能手表要做防水,在外壳上打了防水胶,结果出现播放突然没声音的现象. 原因 一直播放,设备温度升高,因为做了防水密闭导致喇叭腔体气压异常,导致播放没声音. …

pod节点jar包替换流程

1、查找到该docker容器 docker ps | grep backend # ./entrypoint.sh文件启动的那个容器2、替换jar 包 mv xxx.jar app.jar docker cp app.jar 66bc6fea9fb5:/home/aimind/3、重启容器 docker restart 66bc6fea9fb5 4、重启容器后进行功能验证 功能验证没问题了,再…

树莓派点亮led(1)

更换清华源 树莓派更换国内源(清华源)_树莓派更换清华源-CSDN博客 查看python版本 安装pipx 安装引脚 查看引脚 #安装gpio 创建文件夹 创建py文件 运行python文件 ubuntu传递文件到树莓派 1、启用ubuntu端的新终端 2拷贝文件到home目录下的用户文件夹…

数据库内核那些事|细说PolarDB优化器查询变换:IN-List变换

导读 数据库的查询优化器是整个系统的"大脑",一条SQL语句执行是否高效在不同的优化决策下可能会产生几个数量级的性能差异,因此优化器也是数据库系统中最为核心的组件和竞争力之一。阿里云瑶池旗下的云原生数据库PolarDB MySQL版作为领先的云…

【模拟IC学习笔记】 采样保持电路的设计

目录 采样保持工作原理 概念 时域响应-采保信号 采样网络的KT/C噪声 采样电容大小的选取 采样抖动(jitter) jitter对SNR的影响 法一 法二 采样开关的种类 单MOS管 实践:Nmos导通电阻 传输门 栅压自举开关 采样技术 上极板采样 下极板采样 采样保持…

spark的任务提交方式及流程

本地模式 local 测试用,不多赘述 分布式模式 standalone standalone集群是spark 自带的一个资源调度集群,分为两个角色,master/worker,master负责接收任务请求、资源调度(监听端口7077),worker负责运行exec…

NPS 内网穿透安装

NPS 内网穿透安装 NPS 内网穿透安装服务端搭建SSH配置流程 NPS 内网穿透安装 NPS分为服务端和客户端,对应的不同操作系统软件可以在GitHub RELEASES自行选择下载。 服务端搭建 由于个人非企业级使用,为了方便直接使用docker安装 1.docker运行 (注意…

喇叭性能指标

喇叭的技术指标 灵敏度 频率响应曲线 额定阻抗 谐振频率F0 失真THD 灵敏度 灵敏度越高,声音越大。 f0 f0(bass resonace frequency)是最低共振频率(低频下限频),越低表示对低频的响应越好,在满足音腔空间的条件下,声音更饱满. 可直接用f0测试仪测量或通过测量阻…

Qt / day01

1. 思维导图 2. 自由发挥应用场景实现一个登录窗口界面。 代码(mywidget.cpp): #include "mywidget.h"MyWidget::MyWidget(QWidget *parent): QWidget(parent) {// windows setup //setup windows sizethis->resize(600, 370);//set window fixed si…

c/c++基础 自增自减运算符 大白讲解i++/i--/++i/--i

后置运算符:i表示在使用x之后,再使x的值加1,即ii1; 前置运算符:i表示在使用x之前,先使x的值加1,即ii1. 前缀运算和后缀运算的区别:前缀运算是“先变后用”,而后缀运算是“先用后变”…