图像提示词攻略--基于 stable diffusion v2

Stable Diffusion 是一种潜在的文本到图像扩散模型,能够在给定任何文本输入(称为提示)的情况下生成逼真的图像。

在本文中,我将讨论和探索一些提高提示有效性的方法。从在提示中添加某些关键字和组合词、从更改单词顺序及其标点符号开始到更改画面,颜色比例。

内容:

  1. 添加关键词
  2. 添加复合材料
  3. 改变单词的顺序
  4. 更改标点符号
  5. 改变指导尺度

1.添加关键词

我们将尝试其对图像生成的影响:第一个更改是在输入提示中添加不同的单词并观察其效果。我们将使用相同的句子,仅添加一些单词,并将其与使用原始提示生成的图像进行比较,以便更好地直观地了解哪些有效,哪些无效。原来的提示将是:

一只戴着蒸汽朋克帽子的赛博朋克猫

添加的文字如下:

  • 聚焦
  • 锐利的
  • 绘画
  • 粉笔艺术
  • 概念艺术
  • 网络流行
  • 佳能 m 50
  • 特写
  • 素描
  • 错综复杂

因此,我们首先运行原始提示并查看图 1 中的结果:

图 1:一只戴着蒸汽朋克帽子的赛博朋克猫。

现在让我们运行相同的提示,但添加词语聚焦后:

一只戴着蒸汽朋克帽子的赛博朋克猫,聚焦

图 2一只戴着蒸汽朋克帽子的赛博朋克猫,聚焦

将这些图像与原始图像进行比较,我们可以看到图像变得更加集中,这正是这个词应该做的。因此,添加“聚焦”一词可以使图像更加集中并实现预期的效果。

让我们添加单词锐利并查看图 3 中的结果:

图 3

对于“锐利这个词,我们可以观察到图像变得更清晰一些,但我认为它没有多大作用,所以添加这个词会产生一定的效果,但效果不会那么大。

我们来看看添加图4中“绘画”一词的结果:

图4

这个词的效果非常明显,我们现在可以看到所有的图像都在绘画,所以肯定添加这个词会对生成的图像产生强烈的影响。

让我们添加单词概念艺术并查看图 5 中的结果:

图 5

而且,这个词对生成的图像有很强的影响。我们可以看到所有图像都是粉笔、创建的,因此在提示中添加这个词对生成的图像有很强的影响。

我们来看看在生成的图像上添加概念艺术后的效果,如图 6 所示:

图 6

我们可以观察到,添加这个词使生成的图像发生了显着的变化,它们看起来就像是由概念艺术家生成的。

现在我们添加网络流行,看看结果如图 7 所示:

图 7

我们要添加的下一个单词是canon m50,结果如图 8 所示。

图 8

我们可以看到生成的图像变化并不明显,所以添加这个词不会导致生成的图像发生变化。接下来我们看看在生成的图片上添加提示中的特写词的效果如图9所示。

图9

在生成的图像上的提示上添加特写词的效果是显而易见的,我们可以看到图像被放大和关闭。接下来,我们将尝试使用素描,看看它对生成图像的效果,如图 10 所示。

图 10

我们可以看到,添加素描对生成的图像有很强的影响,看起来就像是用木炭绘制的。我们要添加的最后一个词是复杂的词,生成的图像如图 11 所示。

图 11

我们可以看到,与使用原始提示生成的图像相比,该关键字为生成的图像添加了额外的细节。接下来,我们将尝试组合提示中的一些关键字,并观察在提示中添加这些组合的效果。

2. 添加复合材料

我们将添加到提示中的第二个变体是添加我们在上一节中使用的关键字的组合。以下是我们将使用的变体:

  • 素描,复杂,概念艺术
  • 佳能 m50,特写,锐利,聚焦

让我们从第一个合成开始,它在提示中添加了素描、复杂的和概念艺术:

图 12

我们可以看到生成的图像符合我们对添加的关键字的期望,并且图像看起来好像考虑了这三个词并且也对生成的图像产生了影响。我们可以看到生成的图像细节丰富,并且使用木炭绘制,具有概念艺术的味道。

接下来,我们尝试第二个关键字组合,即 canon m50、特写、锐利和 聚焦。结果如图 13 所示。

图 13:

我们可以看到,添加的单词的影响比前面的示例要小,因为正如我们在前面的示例中提到的,这里使用的单词已经产生了很小的影响。对生成的图像影响最强的关键词是特写词,这在生成的图像中非常明显,因为它们靠近猫的脸部。

我们还可以尝试更改关键字的顺序,看看是否会对生成的图像产生影响。让我们在下一节中看看改变词顺序的效果。

3.改变词序

我们已经看到了添加某些关键词的效果以及组合这些关键词的效果。现在我们将看看更改提示中的单词顺序是否会对生成的图像产生影响。我们将从下面的提示开始,然后更改单词的顺序,并查看这对生成的图像的效果。

图 14:使用“戴着蒸汽朋克帽子的赛博朋克猫,复杂,绘画”提示生成的图像。

现在,让我们更改关键字的顺序,并将“绘画”一词添加到提示的开头。结果如图 15 所示。

图 15:使用“绘画,一只戴着蒸汽朋克帽子的赛博朋克猫,错综复杂”提示生成的图像。

我们可以看到,在提示符开头添加关键字绘画使得生成的图像看起来更像一幅画,尤其是左栏图像。您可以看到生成的图像看起来像猫的画。因此,如果您想在提示中强调某个单词,明智的做法是将其放在提示的开头。

现在让我们看看如果我们在提示的开头添加两个关键字会发生什么。结果如图 16 所示。

图 16:使用“绘画,错综复杂,戴着蒸汽朋克帽子的赛博朋克猫”提示生成的图像。

我们再次可以看到,在提示的开头添加关键字使得这些单词对生成的图像有更强的影响。因此,如果您希望生成的图像遵循提示,那么一个非常好的举措是将某些关键字放在提示的开头。

现在我们已经看到了更改提示中的词序的效果,您认为更改提示中的标点符号会对生成的图像产生强烈的影响吗?让我们在下一节中尝试一下,以了解这个问题的答案。

4. 改变标点符号

现在我们将更改提示的标点符号,特别是对于添加的关键字。我们将只尝试三种变体:

  • 首先,我们将在提示末尾添加句号。
  • 其次,我们将添加三个句号。
  • 最后,我们将删除所使用的两个关键字之间的逗号。

像往常一样,我们将从上一节中使用的原始提示开始,这样我们就可以有一个基线进行比较:

图17:一只戴着蒸汽朋克帽子的赛博朋克猫,错综复杂,绘画

让我们在提示末尾添加句号并观察生成的图像的变化,如图 18 所示。

图 18:一幅复杂的绘画,画中一只戴着蒸汽朋克帽子并带有句号的赛博朋克猫。

我认为生成的图像没有太大差异,这意味着在提示末尾添加句号对生成的图像影响很小。

接下来,我们将在提示符末尾添加三个句号,并观察这是否会改变生成的图像。生成的图像如图 19 所示。

图 19:使用“一只戴着蒸汽朋克帽子的赛博朋克猫,错综复杂,绘画……”提示生成的图像。

我们可以看到,在提示末尾添加三个句号不会对生成的图像产生影响。最后,我们删除两个关键字之间的逗号并观察图 20 所示的结果。

图 20:使用“戴着蒸汽朋克帽子的赛博朋克猫,复杂的绘画”提示生成的图像。

同样,我们可以观察到这些图像与第一张图像之间没有太大差异。所以总而言之,我们可以说标点符号的变化不会对生成的图像产生巨大的影响。在下一节中,我们将观察引导比例对生成图像的影响。

5. 改变引导比例

最后,我们将更改引导比例并查看其对生成图像的影响。引导比例决定了生成的图像在多大程度上遵循输入提示,但是在达到一定限制后,它会添加随机内容。我们将使用下面的提示,并尝试使用以下值进行缩放:10(用于上一图像生成的原始值)、15、20、25 和 30。

图 21:一幅复杂的绘画,画的是一只戴着蒸汽朋克帽子的赛博朋克猫,引导比例 = 10。

现在让我们尝试相同的提示,但将引导比例增加到15:

图 22:一幅复杂的绘画,画的是一只戴着蒸汽朋克帽子的赛博朋克猫,引导比例 = 15。

我们可以看到图像现在比之前的图像有了更多的细节并且更加遵循提示。接下来,我们将指导尺度增加到20,观察变化:

图 23:一幅复杂的绘画,画的是一只戴着蒸汽朋克帽子的赛博朋克猫,引导比例 = 20。

该图像现在具有越来越多的细节,并且比前两张图像更遵循提示。然而,如果我们将引导比例增加得更多,它将开始丢失一些定义,并且将开始拥有更多的随机对象。我们可以在图 24 和 25 中观察到这一点,指导比例分别设置为 25 和 30。

图 23:一幅复杂的绘画,画的是一只戴着蒸汽朋克帽子的赛博朋克猫,引导比例 = 25。

图 24:一幅复杂的绘画,画的是一只戴着蒸汽朋克帽子的赛博朋克猫,引导比例 = 30。

总之,添加某些关键字并更改单词的顺序将对生成的图像产生很大的影响。值得注意的是,这是基于 stable diffusion v2 的,因此如果您尝试使用较旧或较新的版本,结果可能会有所不同。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/27081.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

24v转3.3v输出3A用什么芯片

问:客户需要一个能够将24V输入电压转换为3.3V输出电压,并且能够提供1-3A的电流输出的芯片。还希望它能够内置MOS管。有什么推荐的型号吗?(vin24v、5v,vout3.3v,Io1-3A) 答:推荐使用…

【福建事业单位-推理判断】08逻辑论证-加强-原因解释-日常总结

福建事业单位-推理判断】08逻辑论证-加强 一、加强题1.1 建立联系——搭桥1.2 补充论据必要条件(没它不行)补充论据(解释原因和举例论证) 总结 二、原因解释题三、日常结论复习建议 一、加强题 加强的题型,一般只加强…

替换开源LDAP,某科技企业用宁盾目录统一身份,为业务敏捷提供支撑

客户介绍 某高科技企业成立于2015年,是一家深耕于大物流领域的人工智能公司,迄今为止已为全球16个国家和地区,120余家客户打造智能化升级体验,场景覆盖海陆空铁、工厂等货运物流领域。 该公司使用开源LDAP面临的挑战 挑战1 开源…

详解Kafka分区机制原理|Kafka 系列 二

Kafka 系列第二篇,详解分区机制原理。为了不错过更新,请大家将本号“设为星标”。 点击上方“后端开发技术”,选择“设为星标” ,优质资源及时送达 上一篇文章介绍了 Kafka 的基本概念和术语,里面有个概念是 分区(Part…

高翔《自动驾驶中的SLAM技术》代码详解 — 第6章 2D SLAM

目录 6.2 扫描匹配算法 6.2.1 点到点的扫描匹配 6.2 扫描匹配算法 6.2.1 点到点的扫描匹配 // src/ch6/test_2dlidar_io.cc // Created by xiang on 2022/3/15. // #include <gflags/gflags.h> #include <glog/logging.h> #include <opencv2/highgui.hpp>…

解释器模式(Interpreter)

解释器模式是一种行为设计模式&#xff0c;可以解释语言的语法或表达式。给定一个语言&#xff0c;定义它的文法的一种表示&#xff0c;然后定义一个解释器&#xff0c;使用该文法来解释语言中的句子。解释器模式提供了评估语言的语法或表达式的方式。 Interpreter is a behav…

行业追踪,2023-08-07

自动复盘 2023-08-07 凡所有相&#xff0c;皆是虚妄。若见诸相非相&#xff0c;即见如来。 k 线图是最好的老师&#xff0c;每天持续发布板块的rps排名&#xff0c;追踪板块&#xff0c;板块来开仓&#xff0c;板块去清仓&#xff0c;丢弃自以为是的想法&#xff0c;板块去留让…

ros tf

欢迎访问我的博客首页。 tf 1. tf 命令行工具1.1 发布 tf1.2 查看 tf 2.参考 1. tf 命令行工具 1.1 发布 tf 我们根据 cartographer_ros 的 launch 文件 backpack_2d.launch 写一个 tf.launch&#xff0c;并使用命令 roslaunch cartographer_ros tf.launch 启动。该 launch 文件…

【Renpy】设置选项不满足条件禁止选择

【要求】如果某个属性不满足某个要求&#xff0c;则无法选择这个选项。 【版本】Renpy 8.1.1 【实现】 1.在options.rpy文件中添加 define config.menu_include_disabled True 2.在选项中增加if条件。 menu:"Yes" if money > 20: ##如果money小于20这个选项…

3.01 用户在确认订单页收货地址操作

用户在确认订单页面&#xff0c;可以针对收货地址做如下操作&#xff1a; 1. 查询用户的所有收货地址列表 2. 新增收货地址 3. 删除收货地址 4. 修改收货地址 5. 设置默认地址步骤1&#xff1a;创建对应用户地址BO public class AddressBO {private String addressId;private…

高抗干扰LCD液晶屏驱动芯片,低功耗的特性适用于水电气表以及工控仪表类产品

VK2C23是一个点阵式存储映射的LCD驱动器&#xff0c;可支持最大224点&#xff08;56SEGx4COM&#xff09;或者最大416点&#xff08;52SEGx8COM&#xff09;的LCD屏。单片机可通过I2C接口配置显示参数和读写显示数据&#xff0c;也可通过指令进入省电模式。其高抗干扰&#xff…

zookeeper+kafka

目录 Kafka概述 一、为什么需要消息队列&#xff08;MQ&#xff09; 二、使用消息队列的好处 三、消息队列的两种模式 四、Kafka 定义 五、Kafka 简介 六、Kafka 的特性 七、Kafka 系统架构 分区的原因 八、部署kafka 集群 1.下载安装包 2.安装 Kafka 3.修改…

风控安全产品系统设计的一些思考

背景 本篇文章会从系统架构设计的角度&#xff0c;分享在对业务安全风控相关基础安全产品进行系统设计时遇到的问题难点及其解决方案。 内容包括三部分&#xff1a;&#xff08;1&#xff09;风控业务架构&#xff1b;&#xff08;2&#xff09;基础安全产品的职责&#xff1…

mysql8查看执行sql历史日志、慢sql历史日志,配置开启sql历史日志general_log、慢sql历史日志slow_query_log

0.本博客sql总结 -- 1.查看参数 -- 1.1.sql日志和慢sql日志输出方式(TABLE/FILE)。global参数 SHOW GLOBAL VARIABLES LIKE log_output; -- 1.2.sql日志开关。global参数 SHOW GLOBAL VARIABLES LIKE general_log%; -- 1.3.慢sql日志开关。global参数 SHOW GLOBAL VARIABLE…

AWS Amplify 部署node版本18报错修复

Amplify env&#xff1a;Amazon Linux:2 Build Error : Specified Node 18 but GLIBC_2.27 or GLIBC_2.28 not found on build 一、原因 报错原因是因为默认情况下&#xff0c;AWS Amplify 使用 Amazon Linux:2 作为其构建镜像&#xff0c;并自带 GLIBC 2.26。不过&#xff0c;…

UNIX 入门

与 UNIX 建立连接启动会话登录命令提示符修改口令退出系统 简单的 UNIX 命令命令格式ls 命令who 命令虚拟终端 tty伪终端 ptywho am i 命令 cal 命令help 命令man 命令 shell 概述shell 命令更换 shell临时更改 shell永久更改 shell 登录过程 与 UNIX 建立连接 启动会话 要启…

RabbitMQ 备份交换机和死信交换机

为处理生产者生产者将消息推送到交换机中&#xff0c;交换机按照消息中的路由键即自身策略无法将消息投递到指定队列中造成消息丢失的问题&#xff0c;可以使用备份交换机。 为处理在消息队列中到达TTL的过期消息&#xff0c;可采用死信交换机进行消息转存。 通过上述描述可知&…

P1049 [NOIP2001 普及组] 装箱问题(背包)(内附封面)

[NOIP2001 普及组] 装箱问题 题目描述 有一个箱子容量为 V V V&#xff0c;同时有 n n n 个物品&#xff0c;每个物品有一个体积。 现在从 n n n 个物品中&#xff0c;任取若干个装入箱内&#xff08;也可以不取&#xff09;&#xff0c;使箱子的剩余空间最小。输出这个最…

数据库作业(一)

建立一张表&#xff1a; 表里面有多个字段&#xff0c;每一个字段对应一种数据类型 注意&#xff1a;表名&#xff0c;字段名都要起的有意义 1、首先mysql -uroot -p 进入MySQL 2、选择一个数据库并使用 3、创建一张表定义多个字段使用所有数据类型&#xff0c;数字&…

2. 内存分区模型

一、内存分区模型 C程序在执行时&#xff0c;将内存大方向划分为4个区域 代码区&#xff1a;存放函数体的二进制代码&#xff0c;由操作系统进行管理的全局区&#xff1a;存放全局变量和静态变量以及常量栈区&#xff1a;由编译器自动分配释放&#xff0c;存放函数的参数值&a…