深度学习（生成式模型）—— Consistency Models

深度学习（生成式模型）—— Consistency Models

news/2025/4/18 16:36:38/文章来源:https://blog.csdn.net/dhaiuda/article/details/135954989

文章目录

前言
预备知识：SDE与ODE
Method
实验结果

前言

Diffusion model需要多次推断才能生成最终的图像，这将耗费大量的计算资源。前几篇博客我们已经介绍了加速Diffusion model生成图像速率的DDIM和Stable Diffusion，本节将介绍最近大火的Consistency Models（代表模型：Dalle-3），其允许Diffusion model仅经过一次推断就生成最终的图像，同时也允许少量多次推断来生成最终的图像。

预备知识：SDE与ODE

yang song博士在《Score-Based Generative Modeling Through Stochastic Differential Equations》一文中提出可以使用SDE（随机微分方程）来刻画Diffusion model的前向过程，并且用SDE统一了Score-based Model (NCSN)和DDPM的前向过程与反向过程。此外，SDE对应了多个前向过程，即从一张图到某个噪声点的加噪方式有多种，但其中存在一个ODE（常微分方程）形式的前向过程，即不存在随机变量的确定性的前向过程。

具体可查看前一篇博客score-based generative modeling through stochastic differential equations

Method

在这里插入图片描述
Consistency Models的核心可总结为上图，在一条ODE轨迹上（可以简单理解为从一个图像到某个噪声点，每一个步骤加的噪声都是特定的，比如第一步加的噪声为0.1，第二步加的噪声为0.2，一旦图像确定了，则对应的噪声点也会被确定），训练一个模型 $f_\theta(x_t,t)$ ，其满足对于任意的 $t 、 t^{'}$ ，模型的输出都一致，即
$f_\theta(x_t,t)=f_\theta(x_{t'},{t'})\tag{1.0}$

模型 $f_\theta(x_t,t)$ 即为Consistency Models，这里有个关键点，即训练Consistency Models时，必须是在ODE轨迹上。如果是在SDE轨迹，如下图所示，则有一个x对应多个y的情况出现，从同一个点出发，第一次迭代对应的轨迹是黑线，第二次迭代对应的轨迹是红线，模型将很难收敛。

在这里插入图片描述

为了实现式1.0，则只需要采样ODE轨迹上的两个点 $x_t$ ， $x_{t'}$ ，在套用一个L2 或L1 loss即可。
我们可以使用一系列的ODE solver（即在反向过程中不会引入随机性噪声的Diffusion model，例如DDIM）来帮助我们确定ODE轨迹上的两个点。

注意到式1.0也是自监督学习的优化目标，因此也会有收敛到奔溃解的情况，比如模型所有参数都为0，因此作者选用了自监督学习中的MoCo解决此类问题。

上述思路总结出的训练策略为Consistency Distillation，一个训练范式如下图
在这里插入图片描述
如下图，作者也给出了上述算法一些理论上的性质，个人觉得不是本算法的核心，故不总结

此外，作者也提出了Consistency Training的训练策略，即通过往一张图像里持续添加一个固定的噪声来获得一个ODE轨迹

在这里插入图片描述

实验结果

CD表示训练策略为Consistency Distillation，CT表示训练策略为Consistency Training，整体表现上CD优于CT，Dalle3也是使用CD训练的。NFE表示反向过程迭代次数

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/668761.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【Matplotlib】figure方法你真的会了吗！？

【Matplotlib】figure方法你真的会了吗！？

🎈个人主页：甜美的江 🎉欢迎 👍点赞✍评论⭐收藏 🤗收录专栏：matplotlib 🤝希望本文对您有所裨益，如有不足之处，欢迎在评论区提出指正，让我们共同学习、交流进…

阅读更多...

前端工程化之：webpack2-1(常用扩展)

前端工程化之：webpack2-1(常用扩展)

目录前言一、CleanWebpackPlugin 二、HtmlWebpackPlugin 三、CopyPlugin 四、webpack-dev-server 五、file-loader 六、url-loader 七、路径问题前言由于 webpack 、 webpack-cli 、 webpack-dev-server 会存在版本不兼容问题，所以这里使用的版本如下&…

阅读更多...

设计模式全览：编程艺术的精髓!

设计模式全览：编程艺术的精髓!

写在前面请心急的读者直接看往后看「设计模式精炼」！一定不会后悔的！ 在编程世界中，设计模式如同优雅的舞者，缠绕在代码的脉络中，引领着程序走向卓越。设计模式解决的是软件开发中经常出现的问题，他们如同…

阅读更多...

解放双手！ChatGPT助力编写JAVA框架！

解放双手！ChatGPT助力编写JAVA框架！

摘要本文介绍了使用 ChatGPT逐步创建一个简单的Java框架，包括构思、交流、深入优化、逐步完善和性能测试等步骤。亲爱的Javaer们，在平时编码的过程中，你是否曾想过编写一个Java框架去为开发提效？但是要么编写框架时感觉无从下…

阅读更多...

Tauri：相比Electron，还有很长路要走的。

Tauri：相比Electron，还有很长路要走的。

一、Tauri是什么 Tauri是一个开源的框架，用于构建跨平台的桌面应用程序。它允许开发者使用Web技术（如HTML、CSS和JavaScript）来构建高性能的本地应用程序，同时提供了访问底层操作系统功能的能力。 Tauri的设计目标是提供一种简单…

阅读更多...

web读取前端txt并解析

web读取前端txt并解析

用途，解析csv、txt等作为前端变量，方便进行其他操作。假设txt里为数组。 1.html内容 <div class"input-group mb-3"><input type&q…

阅读更多...

CI/CD总结

CI/CD总结

bitbucket deployment: Bitbucket Cloud resources | Bitbucket Cloud | Atlassian Support Jenkins:

阅读更多...

第97讲：MHA高可用集群模拟主库故障以及修复过程

第97讲：MHA高可用集群模拟主库故障以及修复过程

文章目录 1.分析主库故障后哪一个从库会切换为主库2.模拟主库故障观察剩余从库的状态2.1.模拟主库故障2.3.当前主从架构 3.修复故障的主库3.1.修复主库3.2.当前主从架构3.3.恢复MHA 1.分析主库故障后哪一个从库会切换为主库在模拟MHA高可用集群主库故障之前，我们先…

阅读更多...

【JavaSE篇】——抽象类和接口

【JavaSE篇】——抽象类和接口

目录 🎓抽象类 🎈抽象类语法 🎈抽象类特性 🎈抽象类的作用 🎓接口 🎈语法规则 🎈接口特性 🎈接口使用(实现USB接口） 🎈实现多个接口 🎈…

阅读更多...

力扣刷题之旅：进阶篇（一）

力扣刷题之旅：进阶篇（一）

力扣（LeetCode）是一个在线编程平台，主要用于帮助程序员提升算法和数据结构方面的能力。以下是一些力扣上的入门题目，以及它们的解题代码。 --点击进入刷题地址题目1：三数之和题目描述： 给定一个包含n个…

阅读更多...

代码随想录算法训练营第41天 | 343.整数拆分 + 96.不同的二叉搜索树

代码随想录算法训练营第41天 | 343.整数拆分 + 96.不同的二叉搜索树

今日任务 343. 整数拆分 96.不同的二叉搜索树 343.整数拆分 - Medium 题目链接：力扣（LeetCode）官网 - 全球极客挚爱的技术成长平台给定一个正整数 n ，将其拆分为 k 个正整数的和（ k > 2 ）&#xff0…

阅读更多...

springboot+vue实现excel导出

springboot+vue实现excel导出

后端导入pom依赖 <dependency>x<groupId>cn.afterturn</groupId><artifactId>easypoi-spring-boot-starter</artifactId><version>4.2.0</version> </dependency> Entity实体类这里以User为例，可按照自己实际…

阅读更多...

vulhub中AppWeb认证绕过漏洞（CVE-2018-8715）

vulhub中AppWeb认证绕过漏洞（CVE-2018-8715）

AppWeb是Embedthis Software LLC公司负责开发维护的一个基于GPL开源协议的嵌入式Web Server。他使用C/C来编写，能够运行在几乎先进所有流行的操作系统上。当然他最主要的应用场景还是为嵌入式设备提供Web Application容器。 AppWeb可以进行认证配置，其认…

阅读更多...

【CSS】css如何实现字体大小小于12px?

【CSS】css如何实现字体大小小于12px?

【CSS】css如何实现字体大小小于12px? 问题解决方案transform: scale(0.5)（常用）SVG 矢量图设置text 问题文字需要显示为12px，但是小于12px的，浏览器是显示不来的解决方案 transform: scale(0.5)（常用&#xff0…

阅读更多...

树莓派-Ubuntu22.04

树莓派-Ubuntu22.04

树莓派 1 安装Ubuntu系统2 ssh登录3 配置3.1 安装软件3.2 换源3.3 安装桌面3.4 开机脚本 1 安装Ubuntu系统通过制作sdk，使系统在sdk中运行： 下载制作软件：https://www.raspberrypi.com/software/ 下载Ubuntu镜像：https://cn.ub…

阅读更多...

【Day40】代码随想录之动态规划_343. 整数拆分_96.不同的二叉搜索树

【Day40】代码随想录之动态规划_343. 整数拆分_96.不同的二叉搜索树

文章目录动态规划理论基础动规五部曲：出现结果不正确： 343. 整数拆分96.不同的二叉搜索树动态规划理论基础动规五部曲： 确定dp数组下标及dp[i] 的含义。递推公式：比如斐波那契数列 dp[i] dp[i-1] dp[i-2]。初始化dp数组。…

阅读更多...

ubuntu22.04 有一台机器说有4T硬盘，但是df的时候看不到，怎么查找

ubuntu22.04 有一台机器说有4T硬盘，但是df的时候看不到，怎么查找

在 Ubuntu 22.04 上，如果你有一块硬盘在使用df命令时未显示，这通常意味着硬盘尚未被挂载或者根本未被分区和格式化。以下是一些步骤来帮助你识别和准备新硬盘： 1. 检查硬盘是否被系统识别首先，使用lsblk命令来检查系统是否识别…

阅读更多...

基于Springboot开发的JavaWeb作业查重系统[附源码]

基于Springboot开发的JavaWeb作业查重系统[附源码]

基于Springboot开发的JavaWeb作业查重系统[附源码] 🍅 作者主页央顺技术团队 🍅 欢迎点赞 👍 收藏 ⭐留言 📝 🍅 文末获取源码联系方式 📝 🍅 查看下方微信号获取联系方式承接各种定制系统 &a…

阅读更多...

飞机打靶子小游戏

飞机打靶子小游戏

1.飞机可以通过键盘移动，发射子弹. 2.显示得分. 3.靶子随机 4.打到靶子加分并换位 #define _CRT_SECURE_NO_WARNINGS 1#include<stdio.h> #include<stdlib.h> #include <conio.h>//_getch()函数 #include<time.h>#define HIGH 20 #defi…

阅读更多...

zlib交叉编译（rv1126）

zlib交叉编译（rv1126）

目录 1.下载 2.解压 3.配置 4.编译 1.下载 1）下载地址 zlib Home Site 2）下载tar.gz版本下载该版本。 2.解压 1）解压到某个文件夹

阅读更多...

最新文章