Stability AI旗舰图像模型 SDXL1.0发布,AI绘画进入新的时代

Stability AI于7月26号开源了SDXL1.0文生图模型,要知道距离SDXL0.9开源发布也不过一个月,只能说AI发展日新月异。

根据官网介绍,SDXL1.0经过迭代更新,已经是目前世界上最好的图像生成模型

官网根据Discord上的几代实验模型和外部测试,再配合用户的偏好数据,所谓的偏好数据 就是用户更加喜欢哪个模型生成的图像,用数据说话,得出用户最喜欢的模型是SDXL1.0

图片

上图中X轴是模型名称,Y轴是用户偏好比例,可以看出SDXL1.0的用户偏好比例为26.2%,上个月发布的SDXL0.9为24.4%,而目前市面上使用最多的基模SD1.5有4.63%,被用户抛弃的SD2.1只有3.42%,这里应该是指纯粹使用SD基础模型,不包含二创模型。

此外官网也对SDXL1.0进行了详细的介绍,SDXL1.0可以生成几乎任何艺术风格的高质量图片,并没有对模型进行固化式训练,从而确保了风格的绝对自由(同时也说明 二次创作模型有更多的发挥空间,能创作出更多的二次模型)

并且SDXL1.0对颜色,对比度和阴影进行了精心调校,这也使得图片的分辨率得到了提升,基础出图支持1024*1024分辨率,分辨率高了,同时图片质量也上去了。

图片
根据官网例子介绍,sdxl1.0已经可以理解前后,左右空间构图

同时官网也对提示词编写进行了介绍,在使用SD1.5时,用户可能需要添加各种正向提示词如(masterpiece, best quality)画质限定词来获得高质量的图片,在SDXL1.0上只需要简单的提示词 就可以获得高质量图片

图片

并且有了专属词的概念,例如红场(The Red Square) 和红场(red square),这两个词语对于图片的生成不再是一样的

官网也对SDXL的技术架构进行了简单的描述

SDXL1.0 也是历代开放模型参数最多的模型之一,SDXL采用了创新的架构,由35亿参数的基础模型和66亿参数细化器组成,

完整模型由用于潜在扩散的专家混合管道组成:第一步,基础模型生成(有噪声的)潜在模型,然后使用专门用于最终去噪步骤的细化模型对其进行进一步处理。请注意,基本模型也可以用作独立模块 

这种两阶段架构可实现图像生成的稳健性,而不会影响速度或需要过多的计算资源。

SDXL 1.0 应在具有 8GB VRAM 或现成云实例的消费类 GPU 上有效工作。

图片

以上是官网的解释,大概意思是SDXL1.0出图稳定性和SDXL的扩展性都进行了大幅度提高,并且使用过程不会占用过多资源(这里可能大部分人都不懂什么意思,反正这次的SDXL1.0用的技术很新也很D就对了,一斤大米干五斤的活)

但是资源占用还是相对而言的,1050TI显卡SD1.5能跑,但是SDXL1.0就无法出图,并且8G显存上进行运行也是比较讲究运气,对硬件要求还是有了较大的提升,毕竟不可能又要马儿跑又不让马儿吃草吧

同时官网也说明了根据SDXL1.0进行炼丹会更加容易,制作自定义模型和自定义lora也会更加友好,但是目前SDXL1.0不支持controlNet,但是会有专属的controlNet给SDXL1.0使用,并且已经在测试当中了,不久后就会推出。(文件夹已经建好了 没错这里特指老滚6)

图片


总结一下:经过个人实践,的确SDXL1.0出图质量会比SD1.5好不少,但是硬件要求也高了不少,只能说干多少活吃多少饭还是成正比的。但是由于没有controlNet和比较高质量的lora支持,目前也只能干一些比较简单的活,但是后面该有的都会有的。

可能大多数人都没有使用过最基础的SD1.5模型,基本都是使用基于SD1.5的二创模型(甚至还有基于SD1.0的),理解不了SDXL1.0的重要性

图片
万象熔炉就是基于SD1.5创作的
图片
大名鼎鼎的ChilloutMix也是基于SD1.5制作的

为了便于大家理解,我们使用SDXL1.0和SD1.5进行生成对比

图片
关键词只有一只猫,没有任何限制词语

图片

目前我们大多数使用的模型都是基于V1-5-pruned-emaonly 这个模型二创出来的,那么如果把当前使用的模型的底模切换到质量这么高的SDXL1.0上面,二创出来的模型或者lora也会继承SDXL的高质量出图,而且使用起来也会更加简单,抽卡概率大大提升(当然是基于炼丹技术成熟的情况下)

虽然sdxl1.0的出图质量有了革命性的增长,但是也还未能达Midjourney的程度(很多文章说是会威胁到MJ啦,但是我觉得还是有点差距),不过这个差距也在慢慢缩短,相信不久之后,会有更多基于SDXL1.0的高质量模型和lora,大家还是拭目以待吧。

资料来源:

https://stability.ai/blog/stable-diffusion-sdxl-1-announcement

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/21153.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【力扣刷题 | 第二十四天】

目录 前言: 416. 分割等和子集 - 力扣(LeetCode) 总结 前言: 今晚我们爆刷动态规划类型的题目。 416. 分割等和子集 - 力扣(LeetCode) 给你一个 只包含正整数 的 非空 数组 nums 。请你判断是否可以将这…

广州银行信用卡中心:强化数字引擎安全,实现业务稳步增长

广州银行信用卡中心是全国城商行中仅有的两家信用卡专营机构之一,拥有从金融产品研发至销售及后期风险控制、客户服务完整业务链条,曾获“2016年度最佳创新信用卡银行”。 数字引擎驱动业务增长 安全左移降低开发风险 近年来,广州银行信用卡…

day20-101. 对称二叉树

101. 对称二叉树 力扣题目链接 给定一个二叉树,检查它是否是镜像对称的。 思路 镜像对称必要的条件就是根节点的左右子树互相对称 左子树的左孩子 右子树的右孩子左子树的右孩子 右子树的左孩子 递归 使用递归前要确定递归的顺序,是前序、后序还…

【Android】在AndroidStudio开发工具运行Java程序

在Android Studio开发工具中,Android系统开始就是用java语言开发的,还可以java代码来写程序,控制台,桌面应用,还可以写可调用的模块,这里讲一下创建Java程序步骤,方便入门java语言开发。 新建一…

Leetcode-每日一题【剑指 Offer 39. 数组中出现次数超过一半的数字】

题目 数组中有一个数字出现的次数超过数组长度的一半&#xff0c;请找出这个数字。 你可以假设数组是非空的&#xff0c;并且给定的数组总是存在多数元素。 示例 1: 输入: [1, 2, 3, 2, 2, 2, 5, 4, 2]输出: 2 限制&#xff1a; 1 < 数组长度 < 50000 解题思路 前置知…

Docker Compose编排部署LNMP服务

目录 安装docker-ce 阿里云镜像加速器 文件 启动 安装docker-ce [rootlocalhost ~]# wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo --2023-08-03 18:34:32-- http://mirrors.aliyun.com/repo/Centos-7.repo 正在解析主机 m…

观察者模式(Observer)

观察着模式是一种行为设计模式&#xff0c;可以用来定义对象间的一对多依赖关系&#xff0c;使得每当一个对象状态发生改变时&#xff0c;其相关依赖对象皆得到通知并被自动更新。 观察者模式又叫做发布-订阅&#xff08;Publish/Subscribe&#xff09;模式、模型-视图&#xf…

新手指南:流程图中各种图形的含义及用法解析

我们经常在技术设计、沟通、业务演示等一些领域看到流程图&#xff0c;它也可以称为输入输出图。顾名思义&#xff0c;它是指一种简单的工作流程的具体步骤&#xff0c;比如包括一次会议的流程&#xff0c;以及一次生产制造的顺序和过程等。本文将为大家介绍流程图的含义和具体…

【零基础学Rust | 基础系列 | 基础语法】变量,数据类型,运算符,控制流

文章目录 简介&#xff1a;一&#xff0c;变量1&#xff0c;变量的定义2&#xff0c;变量的可变性3&#xff0c;变量的隐藏 二、数据类型1&#xff0c;标量类型2&#xff0c;复合类型 三&#xff0c;运算符1&#xff0c;算术运算符2&#xff0c;比较运算符3&#xff0c;逻辑运算…

在windows配置redis的一些错误及解决方案

目录 Unable to connect to Redis; nested exception is io.lettuce.core.RedisConnectionException:用客户端Redis Desktop Manager一样的密码端口&#xff0c;是可以正常连接的&#xff0c;但是运行java程序之后使用接口请求就会报错 Unable to connect to Redis; nested e…

【JAVA】正则表达式是啥?

个人主页&#xff1a;【&#x1f60a;个人主页】 系列专栏&#xff1a;【❤️初识JAVA】 文章目录 前言正则表达式正则表达式语法正则表达式的特点捕获组实例 前言 如果我们想要判断给定的字符串是否符合正则表达式的过滤逻辑&#xff08;称作“匹配”&#xff09;&#xff0c…

Screens 4 for mac VNC客户端 强大的远程控制工具

Screens 4 for Mac 是一款功能强大的 VNC 客户端软件&#xff0c;为 Mac 用户提供了便捷的远程访问和控制解决方案。无论您是需要远程管理服务器、办公电脑&#xff0c;还是需要远程协助他人解决问题&#xff0c;Screens 4 都是您的理想选择。 Screens 4 for Mac具备简洁直观的…

Mybatis 实体类属性名和表中字段名不一致怎么处理

一. 前言 最近耀哥有学生出去面试&#xff0c;被问到 “Mybatis实体类的属性名和表中的字段名不一致该怎么处理&#xff1f;”&#xff0c;这其实是一个很经典的面试题&#xff0c;接下来耀哥就为大家详细解析一下这道面试题。 二. 分析 2.1 实体类和字段名不一致所带来的后果…

Json文件编辑功能

1 Json格式 JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于 ECMAScript&#xff08;European Computer Manufacturers Association, 欧洲计算机协会制定的js规范&#xff09;的一个子集&#xff0c;采用完全独立于编程语言的文本格式来存储和表示数据。…

Maven引入本地jar包

maven做为一种强大的依赖管理工具&#xff0c;可以帮助我们更方便的管理项目中的依赖&#xff1b;而在使用过程中我们难免会有需要引入本地jar包的需求&#xff0c;这里踩过坑之后我分享俩种引入方式&#xff1b; 1.上传jar到本地maven仓库&#xff0c;再引入 使用此方法后可…

CAD产品设计逆向软件 FARO RevEng Crack

CAD产品设计逆向软件 FARO RevEng 软件平台能为用户带来全面的数字设计体验。该反向工程软件有助于利用三维点云创建和编辑高质量的网格和 CAD 表面&#xff0c;以实现反向工程工作流程。然后&#xff0c;工业设计师可以利用这些网格模型进行进一步设计或三维打印。 RevEng 的商…

【iOS RunLoop】

文章目录 前言-什么是RunLoop&#xff1f;默认情况下主线程的RunLoop原理 1. RunLoop对象RunLoop对象的获取 CFRunLoopRef源码部分&#xff08;引入线程相关&#xff09; 2. RunLoop和线程3. RunLoop相关的类RunLoop相关类的实现CFRunLoopModeRef五种运行模式CommonModes CFRun…

【MMCV】mmpretrain/mmclassification概览、环境安装与验证

概览 MMPretrain 是一个全新升级的预训练开源算法框架,旨在提供各种强大的预训练主干网络, 并支持了不同的预训练策略。MMPretrain 源自著名的开源项目 MMClassification 和 MMSelfSup,并开发了许多令人兴奋的新功能。 目前,预训练阶段对于视觉识别至关重要,凭借丰富而强…

C高级--day2(用户相关操作 磁盘相关操作 shell脚本 修改环境变量)

#include<myhead.h>void fun(int n) {if(n>9){fun(n/10);printf("%d\t",n%10);putchar(10);return;}else{printf("%d\n",n%10);return;} } int main(int argc, const char *argv[]) {int num;printf("请输入一个整数&#xff1a;");sca…

Maven引入本地第三方Jar包

背景 引入第三方的Jar包&#xff0c;本来是在项目结构的库里面引入的jar包&#xff0c;但是用maven打包时报错&#xff0c;所以后面想着用maven引入本地地址的方式。 解决方法 1.将Jar包放到根目录里面&#xff0c;我这边放在了lib文件中,如图所示&#xff1a; 2.在pom文件…