【StableDiffusion】SD1.4、1.5、2.0、2.1 和 SDXL0.9-1.0、SDXL turbo 等的区别

总览

1.基础sd base model家族:SD1.4、SD1.5、SD1.5-LCM、SD2.0、SD2.0-768、SD2.1、SD2.1-768、SD2.1-UNCLIP
2.升级sdxl base model家族:SDXL0.9、SDXL1.0、SDXL1.0-LCM、SDXL-DISTILLED、SDXL-TURBO
3.专门用于视频生成的 SVD 家族:SVD、SVD-XT
4.最新科研:playground-v2、PixArt-α

在这里插入图片描述


一、基础sd base model家族

1.SD1.4

没什么好说的,古老的SD模型,现在已经几乎不使用了

2.SD1.5

生态较好,使用此版本的模型还是比较多的

3.SD1.5-LCM

将 attention 换为 T 个 什么玩意来着 忘了 然后在这些小块里实现 self-attention

4.SD2.0

升级迭代,使用 512*512 像素的图片数据集来训练

5.SD2.0-768

使用 768*768 像素的图片数据集来训练,更精准清晰

6.SD2.1

升级迭代,使用 512*512 像素的图片数据集来训练

7.SD2.1-768

使用 768*768 像素的图片数据集来训练,更精准清晰

8.SD2.1-UNCLIP

借鉴了 OpenAI 的 DALL`2 模型


二、升级sdxl base model家族

1.SDXL0.9

1.0 的内测版本,仅供研究使用

2.SDXL1.0

· 正式发布的 SDXL1.0
· 模型参数更大,基础模型所使用的Unet包含了2.6B(2.6亿)的参数,相比SD1.5的860M(8600万)参数,相差超过三倍。
· 语义理解能力更强,使用了两个CLIP模型的组合,提高了对语言的理解能力。
· 训练数据库更大,通过改进训练方法,将图片尺寸也作为训练参数,大大扩展了训练的图片数量。
· 可以生成种类更加丰富、质量更高的图片,采用两阶段生图流程,第一阶段使用基础模型生成,第二阶段使用细化模型进一步提升画面细节表现。
· 生图分辨率更高,最佳分辨率达到了1024x1024,原生支持更多不同的分辨率。
· 可以在图片中直接生成文本,使得SDXL可以进行海报设计等需要在图片中添加文字的工作。

3.SDXL1.0-LCM

潜在一致性模型,说人话,用更少的步骤、更快的速度生成和 SDXL 一致的图片

4.SDXL-DISTILLED

一个特殊模型,专门为了速度而生,采用了特殊的蒸馏方式

5.SDXL-TURBO

使用蒸馏技术的究极nb版本,由对抗扩散蒸馏 (ADD) 的训练方法提供支持,出图贼快,效果几乎和 SDXL 一致(较比 SDXL 较弱,但几乎无影响)


三、专门用于视频生成的 SVD 家族

1.SVD

支持 14 fps 视频生成
用于 文字转视频、图片转视频,用了巨大的数据集(5.8亿个视频剪辑恐怖如斯)来支持训练

2.SVD-XT

支持 25 fps 视频生成


四、最新科研的 Playground-v2、PixArt-α、

1.Playground-v2

恐怖到能让用户评判分数高出 SDXL1.0 的 2.5倍的最新成果
实际上,好像和 SDXL 差不太多,但是确实 Playgroundv2 的艺术感更强

2.PixArt-α

华为研发的,训练成本极低的一个模型,质量和美感都还不错

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/17086.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

元对象系统

一、定义与基本概念 元对象系统是一个基于Qt框架的核心机制,它提供了运行时类型信息(RTTI)以及信号与槽(Signals and Slots)机制的支持。这个系统使得Qt能够实现许多强大的功能,如信号与槽的自动连接、QObject树结构的管理等。 二、主要特性与功能 运…

开启重学英语之路

为什么学了这么多年的英语还是不能自信的说自己擅长英语。 就算是在学校考了很高的分数,依然不能流利的和外国人对话。 只能说明之前的英语学习方法和学习思路只有问题的,所以不能一头扎进英语知识的学习之中,需要先反问自己一些问题&#…

C++习题(1)

一、题目描述&#xff1a; 二、代码展示&#xff1a; #include <iostream> #include <iomanip> using namespace std; struct Student{char name[20];int id;int age;float score; }; int main() {int n;cin>>n;Student student[n];float sum0.0;for(int i0…

QQ名片满级会员展示生成HTML源码

源码介绍 QQ名片满级会员展示生成HTML源码&#xff0c;源码由HTMLCSSJS组成&#xff0c;双击html文件可以本地运行效果&#xff0c;也可以上传到服务器里面&#xff0c;保存素材去选择QQ个性名片-选择大图模板-把图上传照片墙即可 源码效果 源码下载 蓝奏云&#xff1a;http…

Codeforces远古场 Longest Regular Bracket Sequence (动态规划)

Longest Regular Bracket Sequence 题面翻译 给出一个括号序列&#xff0c;求出最长合法子串和它的数量。 合法的定义&#xff1a;这个序列中左右括号匹配 题目描述 This is yet another problem dealing with regular bracket sequences. We should remind you that a br…

大数据开发面试题【Mysql篇】

181、mysql数据库中的引擎 用于数据存储、处理和保护数据的核心服务&#xff0c;不同的数据库引擎有其各自的特点&#xff0c;常见的引擎&#xff1a;InnoDB&#xff0c;Mylsam、Memory、Mrg_Mylsam、Blackhole innodb&#xff1a;是一个事务性存储引擎&#xff0c;提供了对事…

Docker基础篇之常用命令

文章目录 1. 帮助启动类命令2. 镜像命令3. 容器命令4. 总结 1. 帮助启动类命令 启动docker&#xff1a; systemctl start docker停止docker&#xff1a; systemctl stop docker重启docker&#xff1a; systemctl restart docker查看docker 的运行状态&#xff1a; systemc…

MER 2024 第二届多模态情感识别挑战赛

多模态情感识别是人工智能领域的一个活跃研究课题。它的主要目标是整合多种模态来识别人类的情绪状态。当前的工作通常为基准数据集假设准确的情感标签&#xff0c;并专注于开发更有效的架构。然而&#xff0c;现有技术难以满足实际应用的需求。 清华大学陶建华教授联合中国科学…

Flutter 中的 AspectRatio 小部件:全面指南

Flutter 中的 AspectRatio 小部件&#xff1a;全面指南 Flutter 是一个流行的跨平台 UI 框架&#xff0c;它提供了丰富的小部件来帮助开发者构建高质量的应用程序。在 Flutter 的小部件库中&#xff0c;AspectRatio 是一个非常有用的小部件&#xff0c;它允许开发者以一种简单…

Nodejs配置静态文件路径

使用 Express 中的 express.static 内置中间件函数。 代码如下&#xff1a; const path require("path"); const express require("express"); const app express();app.use(express.static(path.join(__dirname, "public")));app.listen(80…

课时138:变量进阶_变量实践_综合案例

2.1.3 综合案例 学习目标 这一节&#xff0c;我们从 免密认证、脚本实践、小结 三个方面来学习 免密认证 案例需求 A 以主机免密码认证 连接到 远程主机B我们要做主机间免密码认证需要做三个动作1、本机生成密钥对2、对端机器使用公钥文件认证3、验证手工演示 本地主机生成…

预热 618,编程好书推荐——提升你的代码力

文章目录 &#x1f4cb;前言&#x1f3af;编程好书推荐&#x1f4d8; Java领域的经典之作&#x1f40d; Python学习者的宝典&#x1f310; 前端开发者的权威指南&#x1f512; 并发编程的艺术&#x1f916; JVM的深入理解&#x1f3d7; 构建自己的编程语言&#x1f9e0; 编程智…

WJ2EDGKA-5.08-8P功能和参数介绍及PDF资料

WJ2EDGKA-5.08-8P 是一款接线端子&#xff0c;以下是它的主要功能和参数介绍&#xff1a; 间距: 5.08mm&#xff08;0.2英寸&#xff09;&#xff0c;这是指相邻针脚之间的中心距离。 针脚数: 8个针脚&#xff08;1X8Pins&#xff09;&#xff0c;这意味着该端子可以连接8根导线…

01- Redis 中的 String 数据类型和应用场景

1. 介绍 String 是最基本的 key-value 结构&#xff0c;key 是唯一标识&#xff0c;value 是具体的值&#xff0c;value 其实不仅是字符串&#xff0c;也可以是数字&#xff08;整数或浮点数&#xff09;&#xff0c;value 最多可以容纳的数据长度是 512M。 2. 内部实现 Str…

基于Zynq 7000 SoC的迁移设计

基于Zynq 7000 SoC的迁移设计 Vivado IDE工具使用IP集成器进行嵌入式开发。各种IP Vivado IDE IP目录中提供&#xff0c;以适应复杂的设计。您也可以添加 自定义IP到IP目录。 您可以将基于Zynq 7000平台处理器的设计迁移到Vivado design Suite中 使用以下步骤。 1.生成系统基础…

知攻善防应急响应靶机训练-Web3

前言 本次应急响应靶机采用的是知攻善防实验室的Web-3应急响应靶机 靶机下载地址为&#xff1a; https://pan.quark.cn/s/4b6dffd0c51a 相关账户密码 用户:administrator 密码:xj123456xj123456 解题过程 第一题-攻击者的两个IP地址 直接查看apache的log日志搜索.php 发现…

磁力搜索器

磁力链接是一种特殊的下载链接&#xff0c;磁力链接可以理解为一个文件识别码&#xff0c;而并非具体的资源地址&#xff0c;下载软件需要拿着这个识别码去整个互联网(DHT网络)去寻找持有该资源的用户(节点)&#xff0c;如果找到则可以进行传输下载。一般年代越久远的磁力链接下…

今日总结2024/5/27

今日学习了状态压缩DP,状态压缩DP分为棋盘型(基于连通性)和集合型 Acwing.1064 小国王 在 nn的棋盘上放 k个国王&#xff0c;国王可攻击相邻的 8个格子&#xff0c;求使它们无法互相攻击的方案总数。 输入格式 共一行&#xff0c;包含两个整数 n和 k。 输出格式 共一行&…

图像处理知识积累

冲激响应 冲激响应是系统在单位冲激函数激励下引起的零状态响应&#xff0c;它与系统的传递函数互为傅里叶变换关系。在连续时间系统中&#xff0c;任一个信号可以分解为具有不同时延的冲激信号的叠加&#xff0c;因此冲激响应可以描述系统的基本特性。通过电路分析法求解…

【华为OD机试-C卷D卷-200分】篮球游戏(C++/Java/Python)

【华为OD机试】-(A卷+B卷+C卷+D卷)-2024真题合集目录 【华为OD机试】-(C卷+D卷)-2024最新真题目录 题目描述 幼儿园里有一个放倒的圆桶,它是一个线性结构,允许在桶的右边将篮球放入,可以在桶的左边和右边将篮球取出。 每个篮球有单独的编号,老师可以连续放入一个或多个…