3D 生成重建011-LucidDreamer 优化SDS过平滑结果的一种探索

3D 生成重建011-LucidDreamer 优化SDS过平滑结果的一种探索


文章目录

    • 0论文工作
    • 1论文方法
    • 2 效果

0论文工作

文本到3D生成的最新进展标志着生成模型的一个重要里程碑,为在各种现实场景中创建富有想象力的3D资产打开了新的可能性。虽然最近在文本到3D生成方面的进展显示出了希望,但它们在渲染详细和高质量的3D模型方面往往不足。这个问题特别普遍,因为有许多方法都可以使用蒸馏取样(SDS)。本文指出了SDS的一个明显缺陷,即它给三维模型带来了不一致和低质量的更新方向,导致了过度更新平滑作用为了解决这个问题,我们提出了一种新的方法,称为间隔分数匹配(ISM)。ISM采用确定性扩散轨迹,并利用基于区间的分数匹配部分过度平滑。此外,我们将**三维高斯溅(3D GS)**合并到我们的文本到三维生成管道中。大量的实验表明,我们的模型在很大程度上优于最先进的技术质量和培训效率。
LucidDreamer 旨在解决从文本提示生成高保真三维形状的挑战。该论文指出了现有文本到三维方法的关键局限性,特别是它们难以在样本质量和多样性之间取得平衡。LucidDreamer 以区间得分匹配 (ISM) 为中心的新方法,用于三维生成的扩散模型,从而缓解了这些问题。实际上这种sds相减在magic123和sparsefusion等3d生成都用了相似的技巧,只不过不同作者选择了不同的解释角度。甚至在纹理生成也使用了类似技巧。

1论文方法

  1. 现有方法存在的问题:
    多样性有限: 许多文本到三维模型优先考虑生成与文本一致的合理形状,这通常会导致多样性低和输出重复。
    质量和多样性之间的权衡: 在高保真度细节和生成形状的广泛性之间取得平衡是一项重大挑战。
    下图是论文的结构图,可以发现论文的结构上与SDS优化流派的方法保持一样的结构,一个3d表示,渲染新视图,SDS优化。不同的是论文是早期使用3d gaussian splatting表示的方法。另外论文使用了DDIM和ISM等不同处理。
    此外论文用一个图对SDS过平滑进行一个可视化。简单来说,多次的降噪就是在对不同降噪结果直接求了平均,会导致过平滑。
    在这里插入图片描述

在这里插入图片描述

  1. LucidDreamer 的解决方案:
    a) 区间得分匹配 (ISM): 这是 LucidDreamer 创新的核心。 ISM 为训练用于三维形状生成的扩散模型提供了一种新方法。
  • 核心理念: ISM 不是直接预测噪声数据分布,而是侧重于学习数据两个扰动版本之间的差异(得分)。这允许更有效的训练并更好地捕获底层数据流形,从而生成更高质量的样本。
  • 工作原理:
    1. 使用不同的噪声级别对目标三维形状的两个噪声版本进行采样。
    2. 训练扩散模型以预测这两个噪声版本之间的得分(矢量差)。
    3. 在生成过程中,模型通过迭代应用学习到的得分信息来逐渐对随机三维形状进行去噪。
      b) 用于文本引导生成的得分蒸馏: 为了使用文本提示引导生成过程,LucidDreamer 使用了得分蒸馏。
  • 训练文本到得分网络: 训练一个单独的网络将文本描述映射到相应的三维形状得分。该网络充当文本域和三维形状域之间的“翻译器”。
  • 引导生成: 在生成过程中,来自文本到得分网络的得分会影响扩散过程,确保生成的三维形状与给定的文本提示一致。为了克服多面问题,论文还插入一个3d先验模块。
  1. LucidDreamer 的优势:
    高保真生成: 通过利用 ISM,LucidDreamer 可以生成具有令人印象深刻的细节和真实感的三维形状。
    增强的多样性: 与现有方法相比,使用 ISM 有助于生成更广泛的多样化形状,解决了输出重复的问题。
    有效的文本引导: 得分蒸馏方法使模型能够有效地整合文本信息,确保生成的三维形状与输入提示之间语义一致。
    此外论文用一个图对SDS过平滑进行一个可视化。简单来说,多次的降噪就是在对不同降噪结果直接求了平均,会导致过平滑。

2 效果

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/14930.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自建公式,VBA在Excel中解一元一次方程

自建公式,VBA在Excel中解一元一次方程 文章目录 前言一、运行效果图二、操作思路三、代码1.去除方程中未知数,将未知数转为“*0”2.计算方程中常数3.计算方程中未知数的系数一,先将未知数替换成“*1”4.计算方程中未知数的系数二5.计算方程得数前言 小学必考内容:一元一次…

掌握Python基本语法的终极指南【基本语法部分】

一、基本语法部分 1.简单数据类型 1.1字符串类型及操作 字符串访问: 1.索引访问 mystr"Hello world" #索引访问 print(mystr[0]) #H print(mystr[-1]) #d print(mystr[-7]) #o print(mystr[6]) #w 2.切片访问 [头下标:尾下标] &#x…

齐护K210系列教程(三十二)_在线模型训练

在线模型训练 概念理解准备工作1 采集图像1.1 图像要求1.2 使用K210采集图片 2 标注图像3 打包数据集4 上传数据4.1创建项目4.1.1图像分类创建项目4.1.2图像检测创建项目 4.2上传数据4.2.1分类检测上传数据4.2.2图像检测上传数据 5 训练模型6 部署模型以及测试7 测试效果7.1图像…

JDBC总结

目录 JDBC(java database connection) JDBC连接数据库步骤: 1. 在项目中添加jar文件,如图所示 2.加载驱动类 向数据库中插入数据代码示例: 第一种: 第二种: 查询操作 : 第一种: 第二种: JDBC(java database connection) java数据库连接.api(应用程序编程接口) ,可…

一文讲清!传统企业的进销存管理难题该怎么解决?

有没有开源的进销存软件啊? 确实,市面上存在不少开源的进销存软件。但客观地讲,开源软件往往面临着安全隐患,因为代码公开,容易成为黑客攻击的目标。此外,开源软件的功能模块通常较为固定,难以…

初出茅庐的小李博客之MQTT.fx客户端接入EMQX Platform

EMQX Platform 概览 EMQX Platform 是 EMQ 推出的一款面向物联网领域的 MQTT 消息中间件产品。作为全球首个 MQTT 5.0 消息云服务,EMQX Platform 提供了一站式运维代管、独有隔离环境的 MQTT 消息服务。在万物互联的时代,EMQX Platform 可以帮助您快速构…

python数据类型之列表

目录 1.创建列表 2.列表基础操作 常用操作 对列表元素顺序随机打乱 列表下标和切片 字符串分割为列表 列表位移 列表切片替换 3.列表内置方法 4.列表排序 简单排序 使用key参数按指定规则排序 二维列表排序 自定义排序规则函数 5.列表排序算法 选择排序 柱状图…

C# 利用Xejen框架源码,我们来开发一个基于Dapper技术的数据库通用的帮助访问类,通过Dapper的增删改查,可以访问Sqlite数据库

Dapper 是一个轻量级的对象关系映射(ORM)工具,适用于 .NET 平台。它由 Stack Overflow 团队开发,旨在提供简单、高效的数据访问功能。与其他重量级 ORM(如 Entity Framework)相比,Dapper 更加轻…

基于Python图像增强算法:低光增强+图像修复+超分辨率重建

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 一、项目背景与意义 在图像处理与计算机视觉领域,图像增强技术是提高图像质量和可用性的重要手段。在实…

单片机io扩展

输入输出扩展 i2c扩展 方案1:PCF8575 PCF8575双向IO口扩展模块 16位输入输出I2C通讯 单片机级联扩展板 方案2:PCA955A 输出扩展 74HC595 io口扩展模块输出口扩展 参考链接 中微爱芯发[2004] 1号           签发人: (szlcsc.com)https://…

❤ Vscode和Idea都可以使用的-AI插件(官方-百度出的)

❤ Vscode和Idea都可以使用的-AI插件(官方-百度出的) 最新AI特别火,给大家推荐一下最新出的VScode插件,辅助我们写代码! 1、下载地址: > https://comate.baidu.com/zh/shopping?inviteCodefkzlak8f …

jmeter中Ultimate Thread Group设计梯度压测场景

Ultimate Thread Group Ultimate Thread Group 线程组是模拟波浪式压测或者阶梯式负载压测 1、Start Threads Count:线程数量 2、Initial Delay,sec:每组开始添加到测试执行之前的延迟(xx秒开始启动线程) 3、Startu…

python中的线程并行

文章目录 1. 单线程2. 线程池ThreadPoolExecutor 1. 单线程 现在有1154张图片需要顺时针旋转后保存到本地,一般使用循环1154次处理,具体代码如下所示,img_paths中存储1154个图片路径,该代码段耗时约用97ms。 t1time.time() for …

Python筑基之旅-MySQL数据库(四)

目录 一、数据表操作 1、新增记录 1-1、用mysql-connector-python库 1-2、用PyMySQL库 1-3、用PeeWee库 1-4、用SQLAlchemy库 2、删除记录 2-1、用mysql-connector-python库 2-2、用PyMySQL库 2-3、用PeeWee库 2-4、用SQLAlchemy库 3、修改记录 3-1、用mysql-conn…

Java轻松转换Markdown文件到Word和PDF文档

Markdown 凭借其简洁易用的特性,成为创建和编辑纯文本文档的常用选择。但某些时候我们需要更加精致的展示效果,例如在专业分享文档或打印成离线使用的纸质版时,就需要将Markdown文件以其他固定的文档格式呈现。通过将 Markdown 转换为 Word 和…

OpenHarmony实战开发——网络组件axios可以在OpenHarmony上使用了

什么是axios 上古浏览器页面在向服务器请求数据时,因为返回的是整个页面的数据,页面都会强制刷新一下,这对于用户来讲并不是很友好。并且我们只是需要修改页面的部分数据,但是从服务器端发送的却是整个页面的数据,十分…

高效写代码java-推荐插件1(格式转化 ConverterX )-日后待更新

ConverterX 主要功能:格式转化 字符串格式转换 日期转换 Json格式转义 字符格式 快捷键 ctrl shiftS Upper(CODEEASE)字符串全部变成大写Lower(codeease)字符串全部变成小写Camel(codeEase)字符串变成小驼峰ClassCaemel(CodeEase)字符串变成大驼峰UnderlineUpper(CODE_EAS…

python实用系列:按顺序重命名文件

啊,好久没更博客了,今天偶然想换个桌面壁纸,于是上网搜了两个比较满意的桌面壁纸,都是压缩包: 当我想要给他们放到我的桌面壁纸文件里的时候患了难,因为他们的名字有相同的: anime文件夹里边&a…

揭秘!亚马逊、Vinted卖家如何借助自养号测评实现爆单?

​作为一名跨境卖家,你一定梦想着能够在亚马逊上实现爆单,让产品火爆销售。下面就分享五个秘诀,帮助你实现这个梦想: 1. 优质产品:首先,确保你的产品质量优秀,能够满足消费者的需求。品质好的产…

基于Matlab使用BP神经网络进行电力系统短期负荷预测

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 一、项目背景与意义 电力系统的短期负荷预测对于电力调度和能源管理具有至关重要的作用。通过准确地预测电力负荷&…