Stable Diffusion V3测评

1.引言

3月5号,Stability AI发布了介绍Stable Diffusion V3的研究论文,链接地址:戳我
在这里插入图片描述

这是目前他们发布的最先进、功能最强大的图像生成器,与一年多前发布的令人印象深刻的 Stable Diffusion V2.1 相比有了大幅升级。SD3所带来的新功能如下:支持文本渲染、性能更优、更好的图像生成质量。

外网有博客尝试把SD3 生成的图像与两款最流行、功能最强大的人工智能图像生成器Midjourney V6Dall-E 3 做了比较,这里对测评结果进行了相应的转述。

2.测评一

测试一的文本提示词如下:

Photo of a red sphere on top of a blue cube. Behind them is a green triangle, on the right is a dog, on the left is a cat

一张红色球体位于蓝色立方体之上的照片。后面是一个绿色三角形,右边是一只狗,左边是一只猫

我们先来看下SD3的生成效果:
在这里插入图片描述

让人眼前一亮的是猫和狗脖子上的绿色色调。看来 SD3 能够理解环境并模拟光的反射。

相比之下,Midjourney V6Dall-E 3 的图像虽然给人留下了深刻印象,但却在不同方面有所欠缺。二者根据上述提示词所生成的图像分别如下:

在这里插入图片描述
在这里插入图片描述

对比上述结果,Midjourney V6 奇怪地将动物放在蓝色方块上,而 Dall-E 3 的结果则令人费解,文不对题。在这一轮比赛中,SD3 以实际符合提示要求而获得第一名。

3.测评二

实验二的文本提示词如下所示:

Resting on the kitchen table is an embroidered cloth with the text ‘good night’ and an embroidered baby tiger. Next to the cloth there is a lit candle. The lighting is dim and dramatic

灶台上放着一块刺绣布,上面写着 "晚安 "和一只刺绣小老虎。布的旁边有一支点燃的蜡烛。灯光昏暗而富有戏剧性

按照惯例,我们先来看下SD3的表现:

在这里插入图片描述

这张特写照片非常漂亮。我喜欢它将边缘模糊化,而将重点放在老虎和文字上。刺绣的细节也非常棒。大家几乎可以感觉到针脚的刮擦纹理,以及随着针脚变化所带来的模糊效果。

接下来我们看下竞争对手的效果,依次为MidjourneyDall-E3的效果:
在这里插入图片描述
在这里插入图片描述

Midjourney 一如所料,采用了标志性的暗色调和精准的灯光。Dall-E 3在这方面也做得很好,尽管他们都增加了一些提示中没有的其他元素。

个人看法,SD3严格遵守了提示词的要求,所以这一轮测评中它是赢家…不过, Midjourney 的艺术诠释也很让人着迷。

4.测评三

实验三的文本提示词如下所示:

Photo of an 90’s desktop computer on a work desk, on the computer screen it says “welcome”. On the wall in the background we see beautiful graffiti with the text “SD3” very large on the wall.

办公桌上 90 年代台式电脑的照片,电脑屏幕上写着 “欢迎”。背景墙上有美丽的涂鸦,"SD3 "字样非常醒目。

首先,我们先来看下SD3的表现:
在这里插入图片描述

巨大的文字与背景融合得天衣无缝。注意字体的一致性。看起来就像是直接从 Photoshop 中生成的插图。

现在,让我们看看 Midjourney Dall-E 3 的表现:

在这里插入图片描述
在这里插入图片描述

就风格和细节而言,Midjourney很容易入选。但提示要求在墙上写很大的文字,而Midjourney在细节上没有做到这一点。因此,就连贯性而言,SD3 是最佳选择。Dall-E 3 的结果相对逊色不少。

5.总结

从测试图像来看,SD3 显然在文本生成和提示词连贯性方面表现出色,可以说超越了其强大的竞争对手。不过,就图像质量和风格而言,我仍然认为 Midjourney在一些场景下也不容小觑。 但是,与竞争对手不同,Stable Diffusion 一直是开源的,完全免费!这意味着大家很快就能下载 SD3 并在本地免费运行。但这也有一个巨大的弊端,那就是可能会引发严重的社会伦理问题。试想一下,更令人难以区分的深度伪造图像和视频的危害性有多大。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/725291.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LINUX重定向的原理

1.利用文件描述符规则实现重定向 文件描述的分配规则:最小没有使用的下标会分给最新打开的文件 正常printf打印是在stdin标准输出显示器打印,stdin标准输出显示器的fd是1。 所以只要把显示器文件stdin给关闭,再打开一个文件,这个文件的 fd…

HTML静态网页成品作业(HTML+CSS)——新年春节介绍网页设计制作(3个页面)

🎉不定期分享源码,关注不丢失哦 文章目录 一、作品介绍二、作品演示1、首页2、子页13、子页2 三、代码目录四、网站代码HTML部分代码CSS部分代码 五、源码获取 一、作品介绍 🏷️本套采用HTMLCSS,未使用Javacsript代码&#xff0…

【InternLM 笔记】使用InternStudio 体验书生·浦语2-chat-1.8b随记

书生浦语2-chat-1.8b 介绍 书生浦语-1.8B (InternLM2-1.8B) 是第二代浦语模型系列的18亿参数版本。为了方便用户使用和研究,书生浦语-1.8B (InternLM2-1.8B) 共有三个版本的开源模型,他们分别是: InternLM2-1.8B: 具有高质量和高适应灵活性…

双指针算法(2)

611.有效三角形的个数 一、题目描述 OJ题目链接:力扣(LeetCode) 二、思路讲解 首先我们能想到的一定是暴力枚举,它的时间复杂度是(O^3)。 我们可以固定一个最长边,然后在比这条边小的有序数组中找出一个二元组&…

八、西瓜书——特征选择与稀疏学习

1.子集搜索与评价 对于1个学习任务来说,给定属性集,其中有些属性可能很关键、很有用,另一些属性则可能没什么用,我们将属性称为“特征”(feature),对当前学习任务有用的属性称为“相关特征”(relevant feature)、没什么用的属性称为“无关特征”(irrelev…

Vue:双token无感刷新

文章目录 初次授权与发放Token:Access Token的作用:Refresh Token的作用:无感刷新:安全机制:后端创建nest项目AppController 添加login、refresh、getinfo接口创建user.dto.tsAppController添加模拟数据 前端Hbuilder创…

Pytest中实现自动生成测试用例脚本代码!

前言 在Python的测试框架中,我们通常会针对某个系统进行测试用例的维护,在对庞大系统进行用例维护时,往往会发现很多测试用例是差不多的,甚至大多数代码是一样的。 故为了提高我们测试用例维护的效率,在本文中&#…

Redis缓存知识总结

图解缓存 what&how problems&strategy 缓存更新 缓存穿透 缓存雪崩 缓存击穿 (图源自黑马教育)

3.5日常学习

matlab处理数据 自己写了关于detect_data的函数,让它帮我改了,哈哈哈 %改正前function data_chuli(path1,savepath)[num]xlsread(path1,1,B18:F23);a num;ba;cb(:);xlswrite(savepath,c) end%改正后function data_chuli(path1, savepath)num xlsread…

100 spring-security 中 /oauth/token 发送请求不携带参数 报错 “401 Unauthorized“

前言 最近存在这样的一个问题, 大致的复现方式是 访问 /oauth/token 接口, 然后不携带任何参数, 结果 服务器抛出了一个 "401 Unauthorized" 针对这个 401, 这里 梳理一下这个流程, 也会衍生出一些其他的问题 测试用例 客户端这边大致的情况是 构造参数, 然后发…

HashMap 源码解读

文章目录 一、什么是HashMap HashMap 是一种快速的查找并且插入、删除性能都良好的一种 K/V键值对的数据结构,key唯一,value允许重复它基于哈希表的 Map 接口实现,是常用的 Java 集合之一,是非线程安全的。 二、HashMap的数据结…

rtt的io设备框架面向对象学习-触摸设备

目录 1.触摸设备基类2.触摸设备基类的子类3.初始化/构造流程3.1设备驱动层3.2 设备驱动框架层3.3 io设备管理层 4.总结5.使用5.1实例 1.触摸设备基类 此层处于设备驱动框架层。此层的类是抽象类。 在/ components / drivers / include / drivers /touch.h定义了如下touch设备…

C语言----冒泡排序进阶

冒泡排序大家应该到写过吧。但大家可能知道到的冒泡排序有两种方法。而我呢,最近学习到了另外一种方法,现在知道三种方法了。所以想与大家分享一下。但是缺点是第三种是第二种的自实现版。第一种就是我们平常写的普通冒泡排序。第二种就是qsort。第三种就…

Matlab梁单元有限元编程 | 铁木辛柯梁 | 欧拉梁 | Matlab源码 | 理论文本

专栏导读 作者简介:工学博士,高级工程师,专注于工业软件算法研究本文已收录于专栏:《有限元编程从入门到精通》本专栏旨在提供 1.以案例的形式讲解各类有限元问题的程序实现,并提供所有案例完整源码;2.单元…

如何恢复edge的自动翻译功能

介绍:对于英文不好的小伙伴,把英语翻译成中文是有帮助的,而edge可以直接对英文页面翻译这一功能更是受人喜爱,但是,最近发现这一项功能消失了。 原始界面: 下面展示如何恢复该功能。 1.打开edge&#xff…

day06-网路编程

#include <myhead.h>int do_add(sqlite3 *ppDb) {int numb;char name[20];int age;int salary;printf("请输入要插入的信息:");scanf("%d %s %d %d", &numb, name, &age, &salary);char sql[128] "";sprintf(sql, "INSE…

Flutter(四):SingleChildScrollView、GridView

SingleChildScrollView、GridView 遇到的问题 以下代码会报错: class GridViewPage extends StatefulWidget {const GridViewPage({super.key});overrideState<GridViewPage> createState() > _GridViewPage(); }class _GridViewPage extends State<GridViewPage&g…

vscode 通义灵码 插件自动写代码

安装插件 通义灵码安装教程-阿里云 点击立即安装 我是已经安装成功了&#xff0c;所以如下图&#xff0c;没安装的会显示安装&#xff0c;点击安装即可 安装成功之后 侧边栏会出现图标 登录 使用 在编辑框中输入 问题 &#xff0c;会自动生成代码和对应的说明

Cloud+Consul

Cloud整合Zookeeper代替Eureka-CSDN博客 Consul简介 Consul是一套开源的分布式服务发现和配置管理系统 What is Consul? | Consul | HashiCorp DeveloperConsul is a service networking solution that delivers service discovery, service mesh, and network security ca…

Redis中的RDB和AOF持久化机制(一)

Redis持久化 RDB快照(snapshot). 在默认情况下&#xff0c;Redis将内存数据库快照保存在名字为dump.rdb的二进制文件中.Redis可以进行设置,让它在"N秒内数据集至少有M个改动"这一条件被满足时&#xff0c;自动保存一次数据集。比如说&#xff0c;以下设置会让Redis…