【StableDiffusion】SD1.4、1.5、2.0、2.1 和 SDXL0.9-1.0、SDXL turbo 等的区别

总览

1.基础sd base model家族:SD1.4、SD1.5、SD1.5-LCM、SD2.0、SD2.0-768、SD2.1、SD2.1-768、SD2.1-UNCLIP
2.升级sdxl base model家族:SDXL0.9、SDXL1.0、SDXL1.0-LCM、SDXL-DISTILLED、SDXL-TURBO
3.专门用于视频生成的 SVD 家族:SVD、SVD-XT
4.最新科研:playground-v2、PixArt-α

在这里插入图片描述


一、基础sd base model家族

1.SD1.4

没什么好说的,古老的SD模型,现在已经几乎不使用了

2.SD1.5

生态较好,使用此版本的模型还是比较多的

3.SD1.5-LCM

将 attention 换为 T 个 什么玩意来着 忘了 然后在这些小块里实现 self-attention

4.SD2.0

升级迭代,使用 512*512 像素的图片数据集来训练

5.SD2.0-768

使用 768*768 像素的图片数据集来训练,更精准清晰

6.SD2.1

升级迭代,使用 512*512 像素的图片数据集来训练

7.SD2.1-768

使用 768*768 像素的图片数据集来训练,更精准清晰

8.SD2.1-UNCLIP

借鉴了 OpenAI 的 DALL`2 模型


二、升级sdxl base model家族

1.SDXL0.9

1.0 的内测版本,仅供研究使用

2.SDXL1.0

· 正式发布的 SDXL1.0
· 模型参数更大,基础模型所使用的Unet包含了2.6B(2.6亿)的参数,相比SD1.5的860M(8600万)参数,相差超过三倍。
· 语义理解能力更强,使用了两个CLIP模型的组合,提高了对语言的理解能力。
· 训练数据库更大,通过改进训练方法,将图片尺寸也作为训练参数,大大扩展了训练的图片数量。
· 可以生成种类更加丰富、质量更高的图片,采用两阶段生图流程,第一阶段使用基础模型生成,第二阶段使用细化模型进一步提升画面细节表现。
· 生图分辨率更高,最佳分辨率达到了1024x1024,原生支持更多不同的分辨率。
· 可以在图片中直接生成文本,使得SDXL可以进行海报设计等需要在图片中添加文字的工作。

3.SDXL1.0-LCM

潜在一致性模型,说人话,用更少的步骤、更快的速度生成和 SDXL 一致的图片

4.SDXL-DISTILLED

一个特殊模型,专门为了速度而生,采用了特殊的蒸馏方式

5.SDXL-TURBO

使用蒸馏技术的究极nb版本,由对抗扩散蒸馏 (ADD) 的训练方法提供支持,出图贼快,效果几乎和 SDXL 一致(较比 SDXL 较弱,但几乎无影响)


三、专门用于视频生成的 SVD 家族

1.SVD

支持 14 fps 视频生成
用于 文字转视频、图片转视频,用了巨大的数据集(5.8亿个视频剪辑恐怖如斯)来支持训练

2.SVD-XT

支持 25 fps 视频生成


四、最新科研的 Playground-v2、PixArt-α、

1.Playground-v2

恐怖到能让用户评判分数高出 SDXL1.0 的 2.5倍的最新成果
实际上,好像和 SDXL 差不太多,但是确实 Playgroundv2 的艺术感更强

2.PixArt-α

华为研发的,训练成本极低的一个模型,质量和美感都还不错

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/17086.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++习题(1)

一、题目描述&#xff1a; 二、代码展示&#xff1a; #include <iostream> #include <iomanip> using namespace std; struct Student{char name[20];int id;int age;float score; }; int main() {int n;cin>>n;Student student[n];float sum0.0;for(int i0…

QQ名片满级会员展示生成HTML源码

源码介绍 QQ名片满级会员展示生成HTML源码&#xff0c;源码由HTMLCSSJS组成&#xff0c;双击html文件可以本地运行效果&#xff0c;也可以上传到服务器里面&#xff0c;保存素材去选择QQ个性名片-选择大图模板-把图上传照片墙即可 源码效果 源码下载 蓝奏云&#xff1a;http…

大数据开发面试题【Mysql篇】

181、mysql数据库中的引擎 用于数据存储、处理和保护数据的核心服务&#xff0c;不同的数据库引擎有其各自的特点&#xff0c;常见的引擎&#xff1a;InnoDB&#xff0c;Mylsam、Memory、Mrg_Mylsam、Blackhole innodb&#xff1a;是一个事务性存储引擎&#xff0c;提供了对事…

Docker基础篇之常用命令

文章目录 1. 帮助启动类命令2. 镜像命令3. 容器命令4. 总结 1. 帮助启动类命令 启动docker&#xff1a; systemctl start docker停止docker&#xff1a; systemctl stop docker重启docker&#xff1a; systemctl restart docker查看docker 的运行状态&#xff1a; systemc…

MER 2024 第二届多模态情感识别挑战赛

多模态情感识别是人工智能领域的一个活跃研究课题。它的主要目标是整合多种模态来识别人类的情绪状态。当前的工作通常为基准数据集假设准确的情感标签&#xff0c;并专注于开发更有效的架构。然而&#xff0c;现有技术难以满足实际应用的需求。 清华大学陶建华教授联合中国科学…

课时138:变量进阶_变量实践_综合案例

2.1.3 综合案例 学习目标 这一节&#xff0c;我们从 免密认证、脚本实践、小结 三个方面来学习 免密认证 案例需求 A 以主机免密码认证 连接到 远程主机B我们要做主机间免密码认证需要做三个动作1、本机生成密钥对2、对端机器使用公钥文件认证3、验证手工演示 本地主机生成…

预热 618,编程好书推荐——提升你的代码力

文章目录 &#x1f4cb;前言&#x1f3af;编程好书推荐&#x1f4d8; Java领域的经典之作&#x1f40d; Python学习者的宝典&#x1f310; 前端开发者的权威指南&#x1f512; 并发编程的艺术&#x1f916; JVM的深入理解&#x1f3d7; 构建自己的编程语言&#x1f9e0; 编程智…

WJ2EDGKA-5.08-8P功能和参数介绍及PDF资料

WJ2EDGKA-5.08-8P 是一款接线端子&#xff0c;以下是它的主要功能和参数介绍&#xff1a; 间距: 5.08mm&#xff08;0.2英寸&#xff09;&#xff0c;这是指相邻针脚之间的中心距离。 针脚数: 8个针脚&#xff08;1X8Pins&#xff09;&#xff0c;这意味着该端子可以连接8根导线…

基于Zynq 7000 SoC的迁移设计

基于Zynq 7000 SoC的迁移设计 Vivado IDE工具使用IP集成器进行嵌入式开发。各种IP Vivado IDE IP目录中提供&#xff0c;以适应复杂的设计。您也可以添加 自定义IP到IP目录。 您可以将基于Zynq 7000平台处理器的设计迁移到Vivado design Suite中 使用以下步骤。 1.生成系统基础…

知攻善防应急响应靶机训练-Web3

前言 本次应急响应靶机采用的是知攻善防实验室的Web-3应急响应靶机 靶机下载地址为&#xff1a; https://pan.quark.cn/s/4b6dffd0c51a 相关账户密码 用户:administrator 密码:xj123456xj123456 解题过程 第一题-攻击者的两个IP地址 直接查看apache的log日志搜索.php 发现…

三维大场景管理-3Dtiles规范

简介 &#xff1a; 这篇文章都是三年前写的了&#xff0c;一直在笔记库存中&#xff0c;今天把他放出来。主要是讲Cesium 的3Dtiles 格式&#xff0c;当然3Dtiles主要是解决场景管理大场景的LOD实现的问题&#xff0c;不管是剔除渲染性能优化之Culling 剔除或者 LOD 、3Dtiles…

SSM基于微信小程序的校园表白墙的设计与实现-计算机毕业设计源码58219

摘 要 随着我国经济迅速发展&#xff0c;人们对手机的需求越来越大&#xff0c;各种手机软件也都在被广泛应用&#xff0c;但是对于手机进行数据信息管理&#xff0c;对于手机的各种软件也是备受用户的喜爱&#xff0c;校园表白墙微信小程序被用户普遍使用&#xff0c;为方便用…

Java面试八股之自旋是什么意思

Java中的自旋是什么意思 自旋是多线程编程中的一种同步机制&#xff0c;尤其在Java中与锁的实现密切相关。当一个线程尝试获取某个锁&#xff08;如内置锁或显式锁&#xff09;时&#xff0c;如果锁已被其他线程持有&#xff0c;通常的做法是将该线程置于阻塞状态&#xff0c;…

图形学概述

图形学应用 游戏 游戏的画面好坏如何鉴定呢&#xff1f; 看游戏画面是否够亮&#xff1a;渲染中全局光照的好坏 《只狼》 为什么卡通游戏画面看起来是卡通的呢&#xff1f; 《无主之地3》 这些都是图形学需要着手解决的问题 电影 电影《黑客帝国》的特效也是通过计算机…

HTTPS加密过程

今天我们说https具体工作原理。 HTTPS概念 HTTPS是一种网络协议&#xff0c;传统的HTTP是明文传输&#xff0c;非常 不安全&#xff0c;所以HTTPS是基于HTTP基础上进行加密传输内容。 HTTPS使用加密传输方式 第一种是非对称加密&#xff0c;是前期建立连接时候使用的数据加密…

Unity 直线间隔放置物体

直线间隔放置物体 0. 新建一个空物体&#xff0c;挂上脚本ZYF_QuickPlaceObj 设置 间隔距离 和 预制体在Scene中拖动即可按间隔距离实例化物体物体的朝向始终朝向统一方向&#xff0c;并且可以在Scene中拖拽更改 传送门

QML-1- qml简介及项目创建

文章目录 1. QML 简介2. 项目创建3. 目录结构4. CMakeLists.txt 简单介绍5. 运行demo 1. QML 简介 根据官网介绍&#xff0c;qml 为qt一个模块&#xff0c;使用Qml语言开发应用程序和库提供了一个框架。它定义并实现了语言和引擎基础结构&#xff0c;并提供了一个API&#xff…

jQuery事件导读+其它方法

jQuery 事件导读一、事件注册二、事件处理1.内容2.例子&#xff0c;微博绑定事件3.off解绑事件4.自动触发事件 三、事件对象 其他方法一、拷贝对象二、多库共存三、插件 事件导读 一、事件注册 单个事件叫注册&#xff0c;多个事件叫处理 二、事件处理 1.内容 2.例子&#…

今日上新——FCP

今年2月&#xff0c;我们FCC-E产品全新上线了专有D区&#xff0c;专门满足用户对高性价比的稀缺大机型需求。 产品研发组的小伙伴们根本停不下来~ 才几个月&#xff0c;我们又又上新了&#xff01; 今天的新品是FCP&#xff08;fastone Compute Platform&#xff09;&#x…

VMware ESXi中安装Proxmox VE

0、巴拉巴拉 前几天某行业HW&#xff0c;闲暇的时候几个技术人员聊天&#xff0c;臭味相投的聊到自己玩的东西。有个玩家说家里用工作站安装Proxmox VE&#xff0c;然后在上面安装软路由、安装NAS。我以前一直想玩玩&#xff0c;没有付诸行动&#xff0c;所以也想弄个集中的方案…