Stable Diffuse 之 安装文件夹、以及操作界面 UI 、Prompt相关说明

Stable Diffuse 之 安装文件夹、以及操作界面 UI 、Prompt相关说明

目录

Stable Diffuse 之 安装文件夹、以及操作界面 UI 、Prompt相关说明

一、简单介绍

二、安装文件相关说明

三、界面的简单说明

四、prompt 的一些语法简单说明

1、Prompt :正向提示词 ,用文字描述在图像中出现的内容

2、Negative prompt:负面提示词,用文字描述不想在图像中出现的内容


一、简单介绍

Stable Diffusion是一个文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型,可以生成包括人脸在内的任何图像,因为有开源的预训练模型,所以我们也可以在自己的机器上运行它,如下图所示。

Stable Diffusion是一个AI 绘图软件 (开源模型),可本地部署,可切换多种模型,且新的模型和开源库每天都在更新发布,最重要的是免费,没有绘图次数限制。

Github 网址:GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI

二、安装文件相关说明

下面进行以下文件夹进行简单说明:

1)embeddings

2)extensions

3)models

4)outputs

1、embeddings

embeddings 放置训练的 embedding 模型,它可以在我们使用基础模型时,再添加此模型进行叠加效果。 网页界面 UI 对应位置如图

2、extensions

extensions 插件安装目录,在 WebUI 插件安装界面安装后,可以此文件夹中查看,并上传相应的插件模型(如 ControlNet 需要专门的模型)。 网页界面 UI 对应位置如图

3、models

models 模型文件夹,安装时会默认下载 v1-5-pruned-emaonly,我们从其它地方下载的模型可以拷贝到此文件夹,在需要使用某个模型时,可以进行切换, 网页界面 UI 对应位置如图

4、outputs

outputs 生成的图系统会输出到这个文件夹里,可进行查看及保存。 网页界面 UI 对应位置如图

三、界面的简单说明

1、txt2img: 文字生成图片

Sampling method:采样方法

● Euler a :富有创造力,不同步数可以生产出不同的图片。 超过 30~40 步基本就没什么增益了

● Euler:最常见的基础算法,最简单也最快

● DDIM:速度快,一般 20 步差不多

● LMS:eular 的延伸算法,相对更稳定一点,30 步就比较稳定

● PLMS:改进一点的 LMS

● DPM2:DDIM 的一种改进版,速度大约是 DDIM 的两倍

Sampling Steps:采样迭代步数

先随机出一个噪声图片,然后一步步调整图片,向提示词 Prompt 靠拢。其实就是告诉 Stable Diffusion,这样的步骤应该进行多少次,步骤越多,每一步移动也就越小越精确,同时也成比例地增加生成图像所需要的时间。大部分采样器超过 50 步后意义就不大了

Restore faces:优化面部,绘制面部图像特别注意。原理是调用一个神经网络模型对面部进行修复

Tiling:生成一个可以平铺的图像

Highres. fix:先生成低分辩率的图,接着添加细节之后再输出,可以把低分辨率的照片调整到高分辨率

Batch count、 Batch size: 都是生成几张图,前者计算时间长,后者需要显存大

Denoising strength:决定算法对图像内容的保留程度。因为加的噪声少,原图片部分多,加的噪声多,原图片部分少。在 0 处,什么都不会改变,而在 1 处,你会得到一个不相关的图像

CFG Scale:对描述参数的倾向程度(也就是生成图像与提示词的一致程度),越低的值产生越有创意的结果,如果太低,例如 1,那 Promp t就完全没用了。一般在 5~15 之间为好,7,9,12 是 3 个常见的设置值

Seed:种子数,只要种子数、参数、模型都一致,就能重新生成一样的图像,-1 的话是生成一个随机数

2、img2img: 图片生成图片

与 txt2img 类似,在文字提示词的基础上,增加了图片提示。

Denoising strength:与原图一致性的程度,一般大于 0.7 出来的都是新效果,小于 0.3 基本就会原图一致

3、Extras: “无损”放大图片,优化(清晰、扩展)图像

主要将图像进行优化,Resize 设置放大的倍率,GFPGAN visibility 主要对图像清晰度进行优化,CodeFormer visibility 对于老照片及人脸修复很有效,权重参数为 0 时效果最大,为 1 时效果最小,建议从 0.5 开始尝试。

Upscaler 放大算法,一般不清楚可不选,或者选 ESRGAN_4x

Batch from Directory 可以进行批量处理,在 Input directory 中输入需要批量处理图片的目录,在 Output directory 中输入保存结果目录。

Scale to 中,可自定义图片的尺寸

4、PNG info:从图片 exif 里获取图片的信息,如果是 Stable Diffusion 原始生成的 png 图片,图片的 exif 信息里会写入图片生成参数

5、Checkpoint Merger:合并不同的模型,生成新的模型

6、Train:训练 embedding 或者 hypernetwork

7、Settings:设置页面

8、Extensions:插件的安装和管理页面

installed 表示已经安装好的插件

Available 表示在线可用的插件,一般都是从这里安装。

点击 Load from(加载自): 加载出可用的插件,然后按 Ctrl + F,输入想要安装插件的名称,以此进行查找。

install from URL 表示可以根据网址进行制定安装,这里网址一般指的是github 仓库地址

Backup/Restore 用来备份和恢复制定配置的

四、prompt 的一些语法简单说明

1、Prompt :正向提示词 ,用文字描述在图像中出现的内容

正向提示词例子:

(masterpiece:1.331), best quality,illustration,(1girl),
(deep pink hair:1.331), (wavy hair:1.21),(disheveled hair:1.331), messy hair, long bangs, hairs between eyes,(white hair:1.331), multicolored hair,(white bloomers:1.46),(open clothes),
beautiful detailed eyes,purple|red eyes),expressionless,sitting,dark background, moonlight,flower_petals,city,full_moon, 

分隔:不同的关键词tag之间,需要使用英文逗号 , 分隔,逗号前后有空格或者换行不影响结果。例如:1girl,loli,long hair,low twintails(1 个女孩,loli,长发,低双马尾)

混合:WebUI 使用 | 分隔多个关键词,实现混合多个要素,注意混合是同等比例、同时混。例如:1girl,red|blue hair, long hair(1个女孩,红色与蓝色头发混合,长发)

增强/减弱:有两种写法。

● 第一种 (提示词:权重数值):数值从0.1~100,默认状态是 1,低于 1 就是减弱,大于 1 就是加强。例如:(loli:1.21),(one girl:1.21),(cat ears:1.1),(flower hairpin:0.9)

● 第二种 (((提示词))),每套一层()括号增强 1.1 倍,每套一层 [] 减弱 1.1 倍。也就是套两层是1.1*1.1=1.21 倍,套三层是 1.331 倍,套 4 层是 1.4641 倍。例如: ((loli)),((one girl)),(cat ears),[flower hairpin],这与第一种写法等价,所以还是建议使用第一种方式。

渐变:可简单的理解时为,先按某种关键词生成,然后再此基础上向某个方向变化。

[关键词1:关键词2:数字],数字大于 1 理解为第 X 步前为关键词 1,第 X 步后变成关键词 2,数字小于 1 理解为总步数的百分之 X 前为关键词 1,之后变成关键词 2。

例如:a girl with very long [white:yellow:16] hair 等价为开始 a girl with very long white hair

,16步之后 a girl with very long yellow hair

例如:a girl with very long [white:yellow:0.5] hair 等价为开始 a girl with very long white hair,50% 步之后 a girl with very long yellow hair

交替:轮流使用关键词,例如:[cow|horse] in a field,这就是个牛与马的混合物;[cow|horse|cat|dog] in a field 就是牛、马、猫、狗之间混合。

2、Negative prompt:负面提示词,用文字描述不想在图像中出现的内容

一些常见的负面提示词:

lowres,bad anatomy,bad hands,text,error,missing fingers,
extra digit,fewer digits,cropped,worst quality,
low quality,normal quality,jpeg artifacts,signature,
watermark,username,blurry,missing arms,long neck,
Humpbacked,missing limb,too many fingers,
mutated,poorly drawn,out of frame,bad hands,
owres,unclear eyes,poorly drawn,cloned face,bad face

prompt 提示词先介绍到这里,后面将会一篇单独文章进行说明

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/66461.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

docker常见面试问题详解

在面试的时候,面试官常常会问一些问题: docker是什么,能做什么?docker和虚拟机的区别是什么呢?docker是用什么做隔离的?docke的网络类型?docker数据之间是如何通信的?docker的数据保…

论文解读 | OmniObject3D:用于逼真感知、重建和生成的大词汇量3D对象数据集

原创 | 文 BFT机器人 这篇论文的主要目标是介绍和探索OmniObject3D数据集,该数据集包含大量真实扫描的3D物体,涵盖了190个类别,提供了多种丰富的注释,包括纹理3D网格、采样点云、多视图图像等。作者将OmniObject3D应用于多个3D视…

Axure RP暗黑色高保真中后台原型组件模板库及组件库素材

Axure RP暗黑色高保真中后台原型组件模板库及组件库素材,黑色一直以来就可以给人以高级、神秘的语义象征,相比于浅色模式,暗色模式藏着更多可能性。色彩具有层级关系,深色会在视觉感官上自动后退,浅色部分则会向前延展…

springboot:时间格式化的5种方法(解决后端传给前端的时间格式转换问题)推荐使用第4和第5种!

本文转载自:springboot:时间格式化的5种方法(解决后端传给前端的时间显示不一致)_为什么前端格式化日期了后端还要格式化_洛泞的博客-CSDN博客 时间问题演示 为了方便演示,我写了一个简单 Spring Boot 项目&#xff…

SQL sever中表管理

目录 一、创建表: 1.1语法格式: 1.2示例: 二、修改表: 2.1语法格式: 2.2示例: 三、删除表: 3.1语法格式: 3.2示例: 四、查询表: 4.1语法格式&…

PostgreSQL分区表

什么是分区表 数据库分区表将表数据分成更小的物理分片,以此提高性能、可用性、易管理性。分区表是关系型数据库中比较常见的对大表的优化方式,数据库管理系统一般都提供了分区管理,而业务可以直接访问分区表而不需要调整业务架构&#xff0c…

轻量、便捷、高效—经纬恒润AETP助力车载以太网测试

随着自动驾驶技术和智能座舱的不断发展,高宽带、高速率的数据通信对主干网提出了稳定、高效的传输要求,CAN(FD)、LIN已无法充分满足汽车的通信需求。车载以太网作为一种快速且扩展性好的网络技术,已经逐步成为了汽车主干网的首选。 此外&…

【Linux】JumpServer 堡垒机远程访问

文章目录 前言1. 安装Jump server2. 本地访问jump server3. 安装 cpolar内网穿透软件4. 配置Jump server公网访问地址5. 公网远程访问Jump server6. 固定Jump server公网地址 前言 JumpServer 是广受欢迎的开源堡垒机,是符合 4A 规范的专业运维安全审计系统。JumpS…

ISO/IEC/ITU标准如何快速查找(三十九)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生从来没有捷径,只有行动才是治疗恐惧和懒惰的唯一良药. 更多原创,欢迎关注:Android…

C语言每日一练--Day(17)

本专栏为c语言练习专栏,适合刚刚学完c语言的初学者。本专栏每天会不定时更新,通过每天练习,进一步对c语言的重难点知识进行更深入的学习。 今日练习题关键字:数对 截取字符串 💓博主csdn个人主页:小小unico…

使用Visual Studio 2022实现透明按钮和标签、POPUP样式窗体的一种工业系统的UI例程

例程实现的功能说明 1、主窗体采用POPUP样式,无标题栏、无菜单栏,适合工业类软件 2、按钮、标签使用自绘,实现透明样式,可以实现灵活的样式设计,更具设计感 按钮重绘函数:OnDrawItem()按钮样式设定&#…

部署单点elasticsearch

部署elasticsearch 创建网络 因为我们还需要部署kibana容器,因此需要让es和kibana容器互联。这里先创建一个网络 docker network create es-net 拉取镜像 我们采用elasticsearch的7.12.1版本的镜像 docker pull elasticsearch:7.12.1 运行 运行docker命令&a…

科技资讯|苹果发布新专利:可在车内定位苹果的智能设备

根据美国商标和专利局近期公示的清单,苹果公司获得了一项名为《车内定位移动设备的系统和方式》专利,概述了在车内狭窄空间内如何定位 iPhone 等移动设备。 Find My 服务现阶段没有使用 UWB 来追踪 iPhone 或者 iPad,而是依赖 GPS 等相关辅…

为什么删除Windows 11上的Bloatware可以帮助加快你的电脑速度

如果你感觉你的电脑迟钝,彻底清除软件会有所帮助,而且这个过程对Windows用户来说越来越容易。 微软正在使删除以前难以删除的其他预装Windows应用程序成为可能。专家表示,这项新功能可能会改变用户的游戏规则。 科技公司Infatica的主管Vlad…

【C++】多态学习

多态 多态的概念与定义多态的概念构成多态的两个条件虚函数与重写重写的两个特例 final 和 override重载、重写(覆盖)、重定义(隐藏)的对比抽象类多态的原理静态绑定与动态绑定 单继承与多继承关系下的虚函数表(派生类)单继承中的虚函数表查看多继承中的虚函数表查看 菱形继承与…

关于一个git的更新使用流程

1.第一步使用git bash 使用git bash命令来进行操作(当然我是个人比较喜欢用这种方法的) 2. 第二步:连接 3.第三步:进入 4.第四步:查看分支 5.第五步:切换分支 将本地文件更新后之后进行提交 6.第六步&am…

【个人博客系统网站】框架升级 · 工程目录 · 数据库设计

【JavaEE】进阶 个人博客系统(1) 文章目录 【JavaEE】进阶 个人博客系统(1)1. 使用Spring全家桶 MyBatis框架进行开发2. 页面2.1 登录页2.2 注册页2.3 详情页2.4 我的博客列表页3.5 所有人的博客列表页3.6 添加博客页3.7 修改文…

华为云 sfs 服务浅谈

以root用户登录弹性云服务器。 以root用户登录弹性云服务器。 安装NFS客户端。 查看系统是否安装NFS软件包。 CentOS、Red Hat、Oracle Enterprise Linux、SUSE、Euler OS、Fedora或OpenSUSE系统下,执行如下命令: rpm -qa|grep nfs Debian或Ubuntu系统下…

设计模式—观察者模式(Observer)

目录 思维导图 一、什么是观察者模式? 二、有什么优点吗? 三、有什么缺点吗? 四、什么时候使用观察者模式? 五、代码展示 ①、双向耦合的代码 ②、解耦实践一 ③、解耦实践二 ④、观察者模式 六、这个模式涉及到了哪些…

开发一个npm包

1 注册一个npm账号 npm https://www.npmjs.com/ 2 初始化一个npm 项目 npm init -y3编写一段代码 function fn(){return 12 }exports.hellofn;4发布到全局node_module npm install . -g5测试代码 创建一个text文件 npm link heath_apisnode index.js6登录(我默认的 https…