Stability AI 宣布 Stable Diffusion 3 Medium 现已开源,是 Stable Diffusion 3 系列中最新、最先进的文本生成图像 AI 模型 —— 官方声称是 “迄今为止最先进的开源模型”,其性能甚至超过了 Midjourney 6。
Stable Diffusion 3 Medium 模型规格参数达到了 20 亿,可以给用户带来更真实的图片体验。目前用户可以从 Hugging Face 上下载该模型。
SD3 Medium 可以根据用户输入的文本描述,重点克服了文生图模型中手部和脸部的挑战,生成足以乱真的的图像。SD3 Medium 还利用其底层的 Diffusion Transformer 架构,高精度地整合了文字元素
SD3 Medium 的另一个特点是易于使用。相比较一些资源密集型 AI 模型,SD3 Medium 可以在消费级显卡上运行,可以加速普及适配。
Stability AI 表示,Stable Diffusion 3 Medium 代表了生成式人工智能发展的一个重要里程碑,并延续了 Stability AI 致力于使这项强大技术民主化的承诺。
模型:
来源:
Stable Diffusion 3 Medium — Stability AI
Serverless API - Gitee AI
stabilityai/stable-diffusion-3-medium - Gitee AI