一文看尽AI绘画工具 Stable Diffusion发展史,AI绘画究竟发展到什么地步了?!

01、引言

Stable Diffusion 在短短两年内发布了多个版本。最著名的版本是 1.5 和 SDXL。不过,还有许多其他版本值得一提。让我们一起来探索稳定扩散模型的起源和发展。

闲话少说,我们直接开始吧!

02、缺失的SD V1.0版本

Stable Diffusion 的最早版本是V1.1。它由 CompVis 发布,而非 Stability AI。有趣的是,稳定扩散从未有过 1.0 版本。最初的模型称为 Latent Diffusion,由 CompVis 开发,包含文本到图像和inpainting功能。这个模型基本上可以被视为稳定扩散 1.0。但当 Latent Diffusion 演变为 Stable Diffusion 后,就没有再进行更新了。

03、SD V1.1 到 V1.4

2022 年 8 月,CompVis 相继发布了四个版本的稳定扩散软件。随后的每个版本都增加了训练步骤,从而提高了输出质量。

  • SD V1.1: Stable Diffusion 1.1 以 256x256 分辨率训练237,000 步,以 512x512 分辨率训练 197,000 步。

  • SD V1.2: Stable Diffusion 1.2 使用 512x512 分辨率的 515,000 步,并使用 laion-improved-aesthetics 数据集。

  • SD V1.3: StableDiffusion1.3 在1.2的基础上进行了改进,在512x512 分辨率下增加了195,000个步骤,文本调节减少了 10%。

  • SD V1.4: StableDiffusion1.4 同样基于1.2,但以 512x512 分辨率和 laion-aesthetics v2 5+ 数据集进行了 225,000 步训练,并减少了类似的文本调节。

04、SD V1.5

RunwayML 于 2022 年 10 月发布了稳定版 Diffusion 1.5,该版本成为最广泛使用的微调版本。

SD V1.5该版本是 1.2 的增强版,使用 laion-aesthetics v2 5+ 数据集,以 512x512 分辨率训练了 595,000 步。

05、SD V2.0

2022 年 11 月,Stability AI 发布了 Stable Diffusion 2.0,12 月又发布了 2.1。尽管规模更大,但这些模型的受欢迎程度不如 1.5,而且扩展支持有限。

  • SD V2.0: Stable Diffusion 2.0 最初在 256x256 分辨率下进行了 550,000 步训练,随后在 512x512 分辨率下进行了 850,000 步训练,并在 768x768 分辨率下进一步微调了 150,000 步。

  • SD V2.1: Stable Diffusion 2.1 是 2.0 的微调版本,增加了 55000 个步骤和额外的 155000 个微调步骤。

06、Stable Diffusion XL

SDXL 于 2023 年 6 月发布,与之前的版本相比有了显著改进。它在 256x256 分辨率下训练了 600,000 步,在 512x512 分辨率下训练了 200,000 步。SDXL 擅长生成高达 1024x1024 像素的图像,并支持 LoRA 和 ControlNet。

  • SDXL V0.9 base/refiner: Stable Diffusion XL 0.9 基础版/精调版与最终版本相比,图像成像质量较低。

  • SDXL V1.0 base/refiner: Stable Diffusion XL 1.0 正式发布,具有卓越的文本理解和图像生成功能。

  • SDXL V1.0 Beta 2.2.2: 此模型仅通过 Stability AI 开发者平台的API接口独家提供。请将 engine_id 设置为 stable-diffusion-xl-beta-v2-2-2,以便使用。该版本是 SDXL 模型的微调迭代版本,与前一版本相比具有更强的功能。

  • Stable Image Core: 该模型只能通过Stability AI开发者平台上的 v2 应用程序接口访问。根据官方文档,它是 SDXL 的微调版本,旨在提高性能。

07、SD V1.6

Stable Diffusion 1.6 是一个相对陌生的版本,因为它不是一个开源模型。它于 2023 年 11 月在 Stability AI 开发者平台发布。它只能通过 Stability AI 开发者平台的 v1 API 使用(最新的 API 版本为 v2)。

  • SD V1.6: Stable Diffusion 1.6 该版本是 Stable Diffusion 1.5 的微调升级版,据说比前一版本能生成更高质量的图像。

08、SDXL Turbo

2023 年 11 月,SDXL Turbo 推出,利用潜在一致性模型(LCM)将生成步骤从通常的 30~40 步减少到 1~4 步。

  • SDXL Turbo: SDXL Turbo 使用逆向扩散蒸馏 (ADD) 技术来尽量减少生成步骤,但仅限于生成清晰度稍低的 512x512 图像。

  • SD Turbo: Stable Diffusion 2.1 的 Turbo 版本,一直不太流行。

09、Stable Video Diffusion

Stability AI 公司于 2023 年 11 月推出了 SVD,可从单张图像生成短动画,且不会出现闪烁问题。

  • SVD: 稳定视频扩散模型可用于制作14帧、576x1024 像素的动画。

  • SVD-XT: 经过对SVD进行微调后的版本,能以相同的分辨率生成 25 帧动画。

10、 Stable Zero 123

Stable Zero 123 于 2023 年 12 月发布,主要功能是通过单张图像生成 3D 物体,并提供包括物体背面在内的多个视图。

  • Stable Zero123: Stable Zero123 在Zero123上进行训练,与前代产品相比,效果有所改进。

11、Stable Diffusion Cascade

2024 年 2 月,Stability AI 推出了 Stable Diffusion Cascade,它采用三阶段生成流程(ABC 阶段),以更高的效率生成高质量图像。

  • SD Cascade: 稳定扩散级联模型超越了 SDXL,具有更好的性能和多功能性,无需大量微调即可产生各种风格。

12、 SDXL Lightning

SDXL Lightning 紧随 SDXL Turbo 之后推出,可提供更快的生成时间和高质量的结果,因其高效性而受到许多开发人员的青睐。

  • SDXL Lightning 结合SDXL和先进技术,以 1-8 个步骤提供图像,并与 LoRA 和 Unet 集成以提高性能。

13、Stable Diffusion 3

Stable Diffusion 3 于 2024 年 2 月预览,并于 2024 年 4 月通过 API 发布,于2024年6月开放开源模型。

  • SD3: Stable Diffusion 3 通过 Stability AI 开发者平台的 API 提供。该型号在图像质量方面超越了之前的所有版本,并具有强大的文本识别能力。它代表了 Stable Diffusion 系列的最新进展,为各种图像生成任务提供了卓越的性能。

  • SD3 Turbo: StableDiffusion3 Turbo版本提供与Stable Diffusion3 相同的卓越功能,但图像生成速度明显更快。该版本专为那些需要在不影响 Stable Diffusion 3 所提供的高质量和强大文字识别能力的前提下快速获得结果的用户而设计。

14、Stable Video 3D

2024 年 3 月,Stable AI 公司推出了 Stable Video 3D,它能通过单张图像制作 360 度可旋转动画。

  • Stable Video 3D: 该模型可从静态图像生成 21 帧、576x576 像素的动画,为动画渲染提供了一个新的维度。

在这里插入图片描述

截至 2024 年 6 月,Stable Diffusion 已发布了 20 多个版本。每个版本都带来了独特的功能和改进,满足了不同用户的需求。你最喜欢哪个版本?

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/38093.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言快速学习笔记

学习网站:C 语言教程 | 菜鸟教程 (runoob.com)C 语言教程 | 菜鸟教程 (runoob.com)C 语言教程 | 菜鸟教程 (runoob.com) 这个网站知识完整,讲解清晰。 在线C语言编程工具:菜鸟教程在线编辑器 (runoob.com) 国外学习网站:C语言介…

【机器学习】机器学习的重要方法——线性回归算法深度探索与未来展望

欢迎来到 破晓的历程博客 引言 在数据科学日益重要的今天,线性回归算法以其简单、直观和强大的预测能力,成为了众多领域中的基础工具。本文将详细介绍线性回归的基本概念、核心算法,并通过五个具体的使用示例来展示其应用,同时探…

免费分享:2000-2021年全国分省250mNDVI数据集(附下载方法)

NDVI (Normalized Difference Vegetation Index)归一化植被指数,又称标准化植被指数。是目前应用最广泛的植被指数,与植被的分布呈线性相关,是植被生长状态和空间分布的最佳指示因子,也是遥感估算植被覆盖度(FVC,Fract…

深入学习 Kafka(2)- Partition 和 Topic

1. Partition的作用 Topic是逻辑的概念,Partition是物理的概念: Partition 对一个 Topic 的消息进行物理上的分离,让消息可以分布在不同的实体机器上,可以提升系统吞吐量和并行处理能力。每个Partition可以有多个副本&#xff08…

交换机06_vlantrunk

一、虚拟局域网vlan 目的:划分广播域 思科设备如何去配置vlan 创建vlan设置对应的接口模式将接口加入vlan全局模式配置vlan vlan 2 设置接口模式(目前需要将接口加入对应vlan,一般用于连接PC) en conf t int f0/0 switchport m…

学会python——用python编写一个计算机程序(python实例十六)

目录 1.认识Python 2.环境与工具 2.1 python环境 2.2 Visual Studio Code编译 3.编写计算器程序 3.1 代码构思 3.2 代码实例 3.3 运行结果 4.总结 1.认识Python Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。 Python 的设计具有很强的可读…

【C语言】刷题笔记 Day1

多刷题 多思考 【题目1】 实现字母的大小写转换,实现多组输入输出 1. getchar 为输入函数,EOF(end of file)为文件结束标志,通常为文件结束的末尾。 2. 题目中要求实现多组输入输出,那我们用 while 循…

python+django 环境搭建以及post接口封装

1、搭建pythondjango环境 python 3.7.9的版本 具体参考之前的安装教程 django 使用 pip install django 会自动安装 检验安装版本: python -m django --version 2、创建django项目 django-admin startproject projectname 启动项目:python manage.py…

011-GeoGebra基础篇-验证泰勒斯定理(动点在指定曲线上移动)

注意咯,如果说前期的文章随便看看就行,但从这篇往后的内容,则需要君略微动动brain了。当然,后续的文章如果感觉吃力的话,可以看看本专栏序号比较小的文章,可能会对你开卷有益。 若A, B, C是圆周上的三点&am…

Windows PowerShell 添加新配置文件(打开对应的目录,并执行命令)

%SystemRoot%\System32\WindowsPowerShell\v1.0\powershell.exe ./redis-server.exe %SystemRoot%\System32\WindowsPowerShell\v1.0\powershell.exe yarn dev 人工智能学习网站 https://chat.xutongbao.top

数据分析如何在企业中发挥价值

数据分析如何在企业中发挥价值 数据分析的目的是什么为什么怎么做做什么 思考问题流程确认问题拆解问题量化分析 分析数据流程收集数据处理数据制作图表 全流程 数据分析的目的 是什么 通过数据量化企业当前的经营现状或业务事实,将业务细节转换为具体数据&#xf…

通过容器启动QAnything知识库问答系统

QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统,可断网安装使用。目前已支持格式:PDF(pdf),Word(docx),PPT(pptx),XLS(xlsx),Markdown(md)&…

LabVIEW汽车转向器测试系统

绍了一种基于LabVIEW的汽车转向器测试系统。该系统集成了数据采集、控制和分析功能,能够对转向器进行高效、准确的测试。通过LabVIEW平台,实现了对转向器性能参数的实时监测和分析,提升了测试效率和数据精度,为汽车转向器的研发和…

CAM350删除铺铜?

CAM350删除铺铜? 1、选择菜单栏Add 2、选择Polygon Void→Line... 3、然点击需要操作的铜箔,使其高亮 4、用鼠标框选需要删除的部分,然后右击 5、删除后如下图所示 The Layer Bar controls are part of the new Navigation Pane and can also…

OpenStack开源虚拟化平台(二)

目录 三、对象存储服务Swift(一)Swift特性(二)应用场景(三)Swift主要组件(四)Swift基本原理(五)实例分析 四、镜像服务Glance(一)Glan…

JAVA-Redis数据结构—跳跃表(Skiplist)【包含Java实现详情代码】

本人详解 作者:王文峰,参加过 CSDN 2020年度博客之星,《Java王大师王天师》 公众号:JAVA开发王大师,专注于天道酬勤的 Java 开发问题中国国学、传统文化和代码爱好者的程序人生,期待你的关注和支持!本人外号:神秘小峯 山峯 转载说明:务必注明来源(注明:作者:王文峰…

CAAC无人机执照:视距内驾驶员与超视距驾驶员区别详解

CAAC无人机执照中的视距内驾驶员与超视距驾驶员在多个方面存在显著的区别。以下是详细的对比和解释: 1. 定义与操作范围: - 视距内驾驶员(驾驶员证):操作无人机时,无人机必须在操控员的视线范围内&#xff…

数据开源|GigaSpeech 2:三万小时东南亚多语种语音识别开源数据集发布

“Giga”一词源于“gigantic”,互联网上具有海量音频资源,但语音质量良莠不齐,高质量音频文本对数据十分稀缺且标注成本高昂,特别是在小语种领域。GigaSpeech 是一个非常成功的英文开源数据集,以 YouTube 和 Podcast 为…

[数据库原理]关系范式总结(自用)

如有错误,欢迎指正!!! 有一些题目我放在pdf里面了

“核心期刊论文选题与写作技巧分享”——郭顺利

讲师简介: 郭顺利博士,一位拥有管理学博士学位的副教授及硕士生导师,活跃在学术界,同时在多份CSSCI收录期刊中担任审稿专家。在近年的学术生涯中,他发表了超过50篇的核心期刊论文,并成功指导研究生在核心期…