01、引言
Stable Diffusion 在短短两年内发布了多个版本。最著名的版本是 1.5 和 SDXL。不过,还有许多其他版本值得一提。让我们一起来探索稳定扩散模型的起源和发展。
闲话少说,我们直接开始吧!
02、缺失的SD V1.0版本
Stable Diffusion 的最早版本是V1.1。它由 CompVis 发布,而非 Stability AI。有趣的是,稳定扩散从未有过 1.0 版本。最初的模型称为 Latent Diffusion,由 CompVis 开发,包含文本到图像和inpainting功能。这个模型基本上可以被视为稳定扩散 1.0。但当 Latent Diffusion 演变为 Stable Diffusion 后,就没有再进行更新了。
03、SD V1.1 到 V1.4
2022 年 8 月,CompVis 相继发布了四个版本的稳定扩散软件。随后的每个版本都增加了训练步骤,从而提高了输出质量。
-
SD V1.1: Stable Diffusion 1.1 以 256x256 分辨率训练237,000 步,以 512x512 分辨率训练 197,000 步。
-
SD V1.2: Stable Diffusion 1.2 使用 512x512 分辨率的 515,000 步,并使用 laion-improved-aesthetics 数据集。
-
SD V1.3: StableDiffusion1.3 在1.2的基础上进行了改进,在512x512 分辨率下增加了195,000个步骤,文本调节减少了 10%。
-
SD V1.4: StableDiffusion1.4 同样基于1.2,但以 512x512 分辨率和 laion-aesthetics v2 5+ 数据集进行了 225,000 步训练,并减少了类似的文本调节。
04、SD V1.5
RunwayML 于 2022 年 10 月发布了稳定版 Diffusion 1.5,该版本成为最广泛使用的微调版本。
SD V1.5该版本是 1.2 的增强版,使用 laion-aesthetics v2 5+ 数据集,以 512x512 分辨率训练了 595,000 步。
05、SD V2.0
2022 年 11 月,Stability AI 发布了 Stable Diffusion 2.0,12 月又发布了 2.1。尽管规模更大,但这些模型的受欢迎程度不如 1.5,而且扩展支持有限。
-
SD V2.0: Stable Diffusion 2.0 最初在 256x256 分辨率下进行了 550,000 步训练,随后在 512x512 分辨率下进行了 850,000 步训练,并在 768x768 分辨率下进一步微调了 150,000 步。
-
SD V2.1: Stable Diffusion 2.1 是 2.0 的微调版本,增加了 55000 个步骤和额外的 155000 个微调步骤。
06、Stable Diffusion XL
SDXL 于 2023 年 6 月发布,与之前的版本相比有了显著改进。它在 256x256 分辨率下训练了 600,000 步,在 512x512 分辨率下训练了 200,000 步。SDXL 擅长生成高达 1024x1024 像素的图像,并支持 LoRA 和 ControlNet。
-
SDXL V0.9 base/refiner: Stable Diffusion XL 0.9 基础版/精调版与最终版本相比,图像成像质量较低。
-
SDXL V1.0 base/refiner: Stable Diffusion XL 1.0 正式发布,具有卓越的文本理解和图像生成功能。
-
SDXL V1.0 Beta 2.2.2: 此模型仅通过 Stability AI 开发者平台的API接口独家提供。请将 engine_id 设置为 stable-diffusion-xl-beta-v2-2-2,以便使用。该版本是 SDXL 模型的微调迭代版本,与前一版本相比具有更强的功能。
-
Stable Image Core: 该模型只能通过Stability AI开发者平台上的 v2 应用程序接口访问。根据官方文档,它是 SDXL 的微调版本,旨在提高性能。
07、SD V1.6
Stable Diffusion 1.6 是一个相对陌生的版本,因为它不是一个开源模型。它于 2023 年 11 月在 Stability AI 开发者平台发布。它只能通过 Stability AI 开发者平台的 v1 API 使用(最新的 API 版本为 v2)。
- SD V1.6: Stable Diffusion 1.6 该版本是 Stable Diffusion 1.5 的微调升级版,据说比前一版本能生成更高质量的图像。
08、SDXL Turbo
2023 年 11 月,SDXL Turbo 推出,利用潜在一致性模型(LCM)将生成步骤从通常的 30~40 步减少到 1~4 步。
-
SDXL Turbo: SDXL Turbo 使用逆向扩散蒸馏 (ADD) 技术来尽量减少生成步骤,但仅限于生成清晰度稍低的 512x512 图像。
-
SD Turbo: Stable Diffusion 2.1 的 Turbo 版本,一直不太流行。
09、Stable Video Diffusion
Stability AI 公司于 2023 年 11 月推出了 SVD,可从单张图像生成短动画,且不会出现闪烁问题。
-
SVD: 稳定视频扩散模型可用于制作14帧、576x1024 像素的动画。
-
SVD-XT: 经过对SVD进行微调后的版本,能以相同的分辨率生成 25 帧动画。
10、 Stable Zero 123
Stable Zero 123 于 2023 年 12 月发布,主要功能是通过单张图像生成 3D 物体,并提供包括物体背面在内的多个视图。
- Stable Zero123: Stable Zero123 在Zero123上进行训练,与前代产品相比,效果有所改进。
11、Stable Diffusion Cascade
2024 年 2 月,Stability AI 推出了 Stable Diffusion Cascade,它采用三阶段生成流程(ABC 阶段),以更高的效率生成高质量图像。
- SD Cascade: 稳定扩散级联模型超越了 SDXL,具有更好的性能和多功能性,无需大量微调即可产生各种风格。
12、 SDXL Lightning
SDXL Lightning 紧随 SDXL Turbo 之后推出,可提供更快的生成时间和高质量的结果,因其高效性而受到许多开发人员的青睐。
-
SDXL Lightning 结合SDXL和先进技术,以 1-8 个步骤提供图像,并与 LoRA 和 Unet 集成以提高性能。
13、Stable Diffusion 3
Stable Diffusion 3 于 2024 年 2 月预览,并于 2024 年 4 月通过 API 发布,于2024年6月开放开源模型。
-
SD3: Stable Diffusion 3 通过 Stability AI 开发者平台的 API 提供。该型号在图像质量方面超越了之前的所有版本,并具有强大的文本识别能力。它代表了 Stable Diffusion 系列的最新进展,为各种图像生成任务提供了卓越的性能。
-
SD3 Turbo: StableDiffusion3 Turbo版本提供与Stable Diffusion3 相同的卓越功能,但图像生成速度明显更快。该版本专为那些需要在不影响 Stable Diffusion 3 所提供的高质量和强大文字识别能力的前提下快速获得结果的用户而设计。
14、Stable Video 3D
2024 年 3 月,Stable AI 公司推出了 Stable Video 3D,它能通过单张图像制作 360 度可旋转动画。
- Stable Video 3D: 该模型可从静态图像生成 21 帧、576x576 像素的动画,为动画渲染提供了一个新的维度。
截至 2024 年 6 月,Stable Diffusion 已发布了 20 多个版本。每个版本都带来了独特的功能和改进,满足了不同用户的需求。你最喜欢哪个版本?
感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。