在OpenAI发布Sora后,Stability AI也发布了其最新的模型Stabled Diffusion3, 之前的文章中已经和大家介绍过,感兴趣的小伙伴可以点击以下链接阅读。Sora是音视频方向,Stabled Diffusion3是图像生成方向,那么两者没有必然的联系,此外二者的核心部分都是采用了Difusion Transformer的方式。
从Stability AI 在 X 上发布的消息以及已经有一部分人收到了 Stability AI 的邮件证实了 6 月 12 号将会开源 2B 版本的模型-Stable Diffusion 3 Medium。
相关链接
候补注册地址:https://stability.ai/stablediffusion3
SD3的更新特点
-
采用Diffusion Transformer(DiT)架构:Stable Diffusion 3.0采用了与Sora相同的DiT架构,这种架构设计使得系统的扩展性更强,能够处理多种类型的输入数据。
-
支持生成视频、3D内容:Stable Diffusion 3.0发布时,将包含一套完整的工具,支持生成视频、3D以及更多类型的内容创作。
-
模型参数量的增加:从之前的800M参数升级到8亿参数量,这意味着新的模型能够为用户提供更多扩展性选择,同时生成的图片效果更加惊人。
-
图像质量的提升:Stable Diffusion 3.0在图像质量和色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强。