【论文】2405.Phased Consistency Model(港中文提出了AI绘画加速模型,一步采样生成图像,支持SD1.5,SDXL)

论文:https://arxiv.org/abs/2405.18407 (2024.05.30发布)
代码:https://github.com/G-U-N/Phased-Consistency-Model

一、论文要解决什么问题?效果如何? (需要先了解LCM模型)

(阶段性一致性模型:朝着稳定、快速的图像和视频生成方向发展)
一致性模型(CM, Consistency Model)最近在加速生成扩散模型方面取得了显著进展。然而,其在潜在空间(即高分辨率、文本条件的图像生成,简称 LCM, Latent Consistency Model)中的应用仍不令人满意

LCM当前设计的三个主要缺陷:

  1. 一致性差:可以发现使用相同种子在不同推理步骤中生成的结果不一致。(见下图右上)
  2. 可控性(Controllability):尽管稳定扩散可以在广泛的推理步骤(即2-15步)中接受分类器无关指导(CFG, Classifier-Free Guidance),但配备LCM权重后,它们只能接受1-2步的CFG。较大的CFG值会导致曝光问题
  3. 效率(Efficiency):我们发现LCM在少数步骤设置中生成的结果质量较差,特别是在少于4步的推理中

提出的PCM模型的生成效果?

在这里插入图片描述

采样1次

在这里插入图片描述

二、相关工作与对比

LCM (Latent Consistency Model) :https://github.com/luosiallen/latent-consistency-model
相关论文:“Latent Consistency Models: Synthesizing High-Resolution Images with Few-Step Inference”
相关论文:“LCM-LoRA: A Universal Stable-Diffusion Acceleration Module”
SDXL-Turbo:https://huggingface.co/stabilityai/sdxl-turbo
SDXL-Lightning: 2402.Progressive Adversarial Diffusion Distillation.: https://huggingface.co/ByteDance/SDXL-Lightning
InstaFlow!One-Step Stable Diffusion with Rectified Flow: https://github.com/gnobitab/InstaFlow
在这里插入图片描述

三、方法概述

3.1 原论文图3:扩散模型和常微分方程(ODE)

在这里插入图片描述
左侧图
这张图展示了四种不同类型模型(扩散模型、一致性模型、一致性轨迹模型和逐步一致性模型)在训练和推理中的差异。

扩散模型 (Diffusion Models):扩散模型通过拟合得分函数来训练,即估计数据分布的梯度
一致性模型 (Consistency Models): 通过拟合ODE(常微分方程)解来训练。这种模型强制所有轨迹上的点映射到同一个解。
一致性轨迹模型 (Consistency Trajectory Models): 一致性轨迹模型通过拟合任意ODE轨迹来训练。即轨迹中的任意点对之间强制相同的预测。
逐步一致性模型 (Phased Consistency Models) :逐步一致性模型通过拟合分阶段的ODE解来训练。即将ODE轨迹分为多个子轨迹,并在每个子轨迹上强制执行一致性。

右侧图
展示了数据分布和噪声分布之间的转换过程。

  • 橙色实线表示数据分布。
  • 橙色虚线表示从数据分布到噪声分布的正向**SDE(随机微分方程)**过程。
  • 蓝色虚线表示从噪声分布到数据分布的逆向PF-ODE(概率流ODE)过程。

图4:逐步一致性模型 (Phased Consistency Models)的训练流程

这张图展示了逐步一致性模型(PCM)的训练流程。流程图从左到右展示了数据从编码到解码和对抗训练的全过程

在这里插入图片描述
在这里插入图片描述

附录

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/25964.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

后端面试题分享查看测试代码

问题描述 编写一个函数,该函数接受一个字符串作为参数,检查该字符串是否符合密码强度要求, 返回True或False。 要求 密码强度要求如下: 不能小于6个字符必须出现大写、小写、数字、特殊字符(!#$%^&*_-&#xf…

(免费领源码)基于 node.js#vue#mysql的网上游戏商城35112-计算机毕业设计项目选题推荐

摘 要 本论文主要论述了如何使用node.js语言开发一个基于vue的网上游戏商城,本系统将严格按照软件开发流程进行各个阶段的工作,本系统采用的数据库是Mysql,使用node.js的koa技术技术构建的一个管理系统,实现了本系统的全部功能。在…

Java--Math类和Random类

1.Math类简介 1.Math类中提供了大量用于数学运算的相关方法。 2.Math类是使用final修饰的终结类,不能产生子类 3.Math类中的方法都是static修饰的静态方法,可以通过类名.方法名直接调用 2.Math常用方法 1.abs(int):求绝对值(int,long,floa…

ABB机器人修改IO信号的具体方法介绍

ABB机器人修改IO信号的具体方法介绍 具体步骤可从参考以下内容: 导出IO配置文件 打开【控制面板】-【配置】-【I/O System】-【文件】-【‘EIO’另存为】,就可以保存IO配置文件【EIO.cfg】用RobotStudio软件打开EIO.cfg文件在软件界面,鼠标右击,选择【I/O信号数据编辑器】选…

【MyBatis-plus】saveBatch 性能调优和【MyBatis】的数据批量入库

总结最优的两种方法: 方法1: 使用了【MyBatis-plus】saveBatch 但是数据入库效率依旧很慢,那可能是是因为JDBC没有配置,saveBatch 批量写入并没有生效哦!!! 详细配置如下:批量数据入…

数据结构---外部排序

个人介绍 hello hello~ ,这里是 code袁~💖💖 ,欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹 🦁作者简介:一名喜欢分享和记录学习的…

【计算机毕业设计】266基于微信小程序的在线点餐

🙊作者简介:拥有多年开发工作经验,分享技术代码帮助学生学习,独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。🌹赠送计算机毕业设计600个选题excel文件,帮助大学选题。赠送开题报告模板&#xff…

【Nature子刊】最争气国人友好“灌水刊”,中科院3区升2区,录用仅1个月,2天见刊!

本周投稿推荐 SSCI • 中科院2区,6.0-7.0(录用友好) EI • 各领域沾边均可(2天录用) CNKI • 7天录用-检索(急录友好) SCI&EI • 4区生物医学类,0.5-1.0(录用…

【单片机毕业设计9-基于stm32c8t6的酒窖监测系统】

【单片机毕业设计9-基于stm32c8t6的酒窖监测系统】 前言一、功能介绍二、硬件部分三、软件部分总结 前言 🔥这里是小殷学长,单片机毕业设计篇9基于stm32的酒窖监测系统 🧿创作不易,拒绝白嫖可私 一、功能介绍 -------------------…

responses-validator接口断言之状态码

概述 responses-validator 专用于对 reqeuests 的响应对象进行断言, 同时,为了更适用 yaml 的场景,支持了多种灵活、可扩展的写法,可用于搭建yaml接口自动化测试框架。 根据 reqeuests 响应对象的特点,responses-val…

JVM知识点

JVM是什么 JVM(Java Virtual Machine)是 Java 虚拟机,用于运行 Java 编译后的二进制字节码,最后生成机器指令。JVM 是 Java 能够跨平台的核心 JDK,JRE,JVM三者关系 三者的关系是:一层层的嵌套关…

第26讲:Ceph集群OSD扩缩容中Reblanceing数据重分布

文章目录 1.Reblanceing数据重分布的概念2.验证Reblanceing触发的过程3.Reblanceing细节4.临时关闭Reblanceing机制 1.Reblanceing数据重分布的概念 当集群中OSD进行扩缩容操作后,会触发一个Reblanceing数据重分布的机制,简单的理解就是将扩缩容前后OSD…

护理考试搜题软件哪个免费?分享九个搜题直接出答案的软件 #知识分享#微信

培养自己的阅读习惯,并不仅仅限于课外读物,还包括学术期刊、行业报告等,以不断提升自己的知识水平和思考能力。 1.彩虹搜题 这是一个公众号 是一款专门针对于大学生或者是成年自考等学生顺利完成证件考试的应用软件,这款软件涵…

详细介绍 CNN 完成 CIFAR 图像分类任务

准备工作 这里用到的是: tensorflow-cpu 2.4 版本python 3.8 版本anaconda 自带的 jupyter notebook 本文大纲 加载、展示、处理 CIFAR 图像数据搭建 CNN 模型架构编译、训练模型测试模型 加载、展示、处理 CIFAR 图像数据 (1)这里国内…

一.iOS核心动画 - 关于图层与视图

引言 Core Animation听起来会让人误以为它只是用来做动画的,但是事实上它是从Layer Kit库演变而来的,其中做动画的功能只是Core Animation特性的一小部分。 Core Animation是一个复核引起,它的作用就是尽可能快地组合屏幕上不同的显示内容&…

Python | Leetcode Python题解之第143题重排链表

题目: 题解: class Solution:def reorderList(self, head: ListNode) -> None:if not head:returnmid self.middleNode(head)l1 headl2 mid.nextmid.next Nonel2 self.reverseList(l2)self.mergeList(l1, l2)def middleNode(self, head: ListNo…

18.2 HTTP服务器-处理函数、响应404错误

1. 处理函数 处理来自客户端的请求,并回之以特定的响应,这是处理函数的主要任务。在处理函数中,我们通常会完成如下工作: 验证请求路径 http.Request.URL.Pathhttp.NotFound(...) 当请求没有对应的处理函数时,返回4…

Vue3【十六】TS中的接口、泛型,自定义类型

Vue3【十六】TS中的接口、泛型&#xff0c;自定义类型 TS中的接口、泛型&#xff0c;自定义类型 案例截图 目录结构 代码 app.vue <template><div class"app"><h1>你好世界! 我是App根组件</h1><Person /></div> </templat…

OpenAI官方Prompt工程指南详解!再也不怕写不好Prompt了!

使用AI聊天、AI写作、还是AI绘图等过程中Prompt具有重要意义。 那么Prompt要怎么写效果才好&#xff1f;有没有标准化的模板可以直接用&#xff1f; 有&#xff0c;OpenAI官方发布了一份提示词工程指南&#xff0c;该指南分享了6大策略即可让AI输出更好的结果。至此&#xff…

无线领夹麦克风哪个品牌性价比高?推荐领夹麦克风性价比最高品牌

当今的直播、短视频已经深深的融入到了我们的生活当中&#xff0c;很多小伙伴会通过拍摄短视频、Vlog来分享自己生活精彩的瞬间。不过录制视频时&#xff0c;如果单纯靠手机拾音&#xff0c;距离手机越远&#xff0c;声音越小越不清晰如果有噪音干扰&#xff0c;那更是“惨不忍…