AI绘画-Stable Diffusion笔记

软件:Stable Diffusion

视频教程来自
https://www.bilibili.com/video/BV1As4y127HW/?spm_id_from=333.337.search-card.all.click

提示词

提示词类别

  • 内容型提示词
    人物主题特征:
    服饰穿搭:white dress
    发型发色:blonde hair,long hair
    五官特点:small eyes,big mouth
    面部表情:smiling
    肢体动作:stretching arms,Spread legs open,Lower body nudity
    场景特征:
    室内、室外:indoor/outdoor
    大场景:forest,city,street
    小细节:tree,bush,white flower
    环境光照:
    白天黑夜:day/night
    特定时段:morning,.sunset
    光环境:sunlight,bright,dark
    天空:blue sky,.starry sky
    画幅视角:
    距离:close-up,distant
    人物比例:full body,upper body
    观察视角:from above,view of back
    镜头类型:wide angle,

  • 标准化提示词
    画质提示词:
    通用高画质:best quality,ultra-detailed,masterpiece,hires,8k(最佳质量,超精细,杰作,招聘,8k)
    特定高分辨率类型:
    extremely detailed CG unity8 k wallpaper(超精细的8 Unity游戏CG)
    unreal engine rendered(虚幻引擎渲染)
    画风提示词:
    插画风:lustration,painting,paint brush(光泽,油漆,油漆刷)
    二次元:anime,comic,game CG(动漫、漫画、游戏CG)
    写实风:photorealistic,realistic,photograph(逼真的,逼真的)

提示词语法

  • 权重增减
  1. 括号加数字
    例:(white flower:1.5)
    含义:调节白花(White flower)的权重为原来的1.5倍(增强)
  2. 套括号
    圆括号(增强):(((white flower))),每套一层,额外x1.1倍。
    此处:调节白花(Vhite flower)的权重为原来的1.11.11.1=1.331倍(增强)
    大括号(小增强):{{{white flower}}},每套一层,额外x1.05倍。
    此处:调节白花(White flower)的权重为原来的约1.15倍(增强)
    方括号(削弱):[[[white flower]]],每套一层,额外x0.9倍。
    此处:调节白花(White flower)的权重为原来的约0.729倍(削弱)
    提示词获取
  3. 百度翻译自定义需求
  4. 图生图功能反推提示词
  5. 参考模型网站例图的提示词
  • OpenArt:https://openart.ai/
  • ArtHubAi:https://arthub.ai/
  1. 利用提示词工具
  • 一个工具箱:http://www.atoolbox.net/Tool.php?Id=1101
  • AI词语加速器:https://ai.dawnmark.cn/

提示词污染

提示词污染可以考虑使用cutoff这个插件,一定程度上能缓解颜色混乱的问题。
但是prompt不听话本质上是个跟SD底层架构有关的问题,具体到你的情况下可能原因非常多,需要自己尝试排除,是个苦功夫:

  1. 用了炼的不好的模型(包含大模型和LoRA):对提示词依从性不好,模型总是有自己的想法,这种情况下可以换个同类型的模型或者调整对应权重来测试
  2. 提示词写的有问题:数量太多、顺序不对、分组不对、过度重复、权重分配、拼写错误……等等都有可能,用提示词矩阵和提示词搜索替换来排查
  3. 参数不优:分辨率、采样算法、采样步数、CFG、高清修复降噪强度等等,用XYZ plot排查
  4. 你碰到SD的能力极限了:这种时候就得依靠图生图、场外PS和inpainting来回修图了,没啥好办法

出图参数

[图片]

迭代步数 (Steps):迭代步数越多,画面越清晰,大于20步之后区别不大,推荐最大值40
采样方法 (Sampler):Euler适合插画,画面朴素;DPM2M和2MKarras速度较快;推荐后面几个带有加号的
[图片]

宽度和高度:影响分辨率,但是不建议太高容易出现显存不足和多人多手多脚
提示词引导系数:画面和提示词的相关性,推荐7~12
随机种子数:-1代表随机种子,也可以使用后面的绿色按钮固定种子
总批次数:ai一次性给你绘画多少次,可以调高
单批数量:ai一次给你画几张,不建议调高

图像放大

高分辨率修复

[图片]

面部修复:通常勾选
平铺图:不要勾选
高分辨率修复:用来增加画面分辨率,放大倍数一般2~3,
重绘幅度:重绘幅度越高作出的画和原作越不像。重绘幅度太低容易出现边缘模糊,重绘幅度太高容易出现不必要的细节和变形,推荐0.30.5或者0.50.7
放大算法:推荐R-ESRGAN 4x+或者R-ESRGAN 4x+Anime6B(二次元)

潜变量算法(Latent)在低分二次元图的重绘中有着超越奇迹的效果,当你的模型在512x512级别的低分质量,缺少细节信息的时候,使用潜变量算法提高到0.6-0.7的重绘幅度能让你的图片直接从死复生。不过潜变量计算较为慢速,这里推荐放大幅度到1.5倍即可。后续在sd图中图插件分块vae中有潜变量空间调用,可以二次增加优化,推荐开启,再次放大1.5 重绘幅度在0.2即可。在分块中越大的重绘越不可取,如果图片细节丰富使用潜变量容易出现蹦图,因为潜变量重绘幅度过高,很容易对整体画面进行一次核打击。

SD Upscale放大脚本

这里的重叠像素为64,因此需要在宽高的部分各加64以此避免拼接区域的割裂
[图片]

不过我们现在有了更加好用的放大脚本,相当于升级版——Ultimate SD Upscale

后期处理放大

还可以使用后期处理里面的放大,这里的放大就不会涉及重绘幅度,属于原原本本的放大
[图片]

大模型(Checkpoint)

决定主要绘图质量
大小:大,3~7G
文件目录:models\Stable-diffusion
后缀:.ckpt .safetensors(更小更安全)
模型分类:二次元、真实、2.5D

变分自动编码器(VAE)

调色滤镜,主要影响画面色彩质感
经典通用:kl-f8-anime2.ckpt
文件目录:models\VAE
后缀:.ckpt .pt .safetensors
推荐将模型推荐的VAE改成和模型一样的名字
推荐VAE

二次元模型:
Anything:是最受欢迎的二次元融合模型。针对二次元风格拥有非常好的效果,可以用简单的词语也创造出不错的效果,可以利用它打造出非常接近于类似动漫插画、角色立绘等的画面风格。
Counterfeit:是一款泛用性很广的插画风模型,细节还原度高,可以生产出各种包含复杂、室内外场景的绘画作品,非常适合喜欢精致感风格的创作者。
Dreamlike diffusion:是一个受欢迎且非常有特色的漫画、插画风模型,可以创作出超现实的魔幻主题作品,具有幻想色彩的画面和作品。
真实模型:
Deliberate:目前最好用的真实性模型之一可以生成非常具有真实质感的图像,可以用来做人物、机器等的生成;图片生成自由度高,非常适合设计师和艺术家的头脑风暴可以用来生成各种高度自由度的图片。
realistic vision:可以用来做人像、食物、动物等的生成,非常适合创作者创作非常具有真实感的作品 limitless
originality free from interference(LOF):人物面部处理比较精致,是能真正实现照片级人像输出的大模型。
2.5D模型:
NeverEnding Dream:在造人方面有自己的一套独特审美,被许多创作者拿来结合lara,进行动漫游戏角色的二次创作,提供真实感,恰到好处地满足观众对二次元世界的想象,却又不至于在真实世界里产生过分的陌生感。
protogen:可以算是一个真实性模型,但是在实现效果上的弹性给创作带来了很多额外的自由度,可以用来描绘非常具有魔幻感的超现实画面
protogen建议使用v2.2版本,生成图略偏迪士尼3D画风,这个版本对一些tag敏感度比较奇怪,比如(beautiful detailed eyes),生成的人物眼睛简直勾魂,(detailed face)就大概率生成手办风的图片,对眼睛颜色tag就不怎么敏感。
protogen其他版本更偏真实向,但审美非常西方化,比起其他写实风模型并无优势。
另外整个protogen系列出的东方脸都是刻板印象脸,只要有亚洲相关tag,出的图都很丑逼
GuoFeng3:该模型训练生成自国内作者,整体质感偏2.5D,非常适合用来生成古风的人物服饰场景,产出的女性人像外貌也非常符合国人的审美。

文本嵌入(Embeddings)

在P站也被叫做Textual Inversion
大小:很小
文件目录:\embeddings
后缀:.pt .safetensors(更小更安全)
使用时需要参考作者给出的权重参考,为了防止过度呈现,一般会限制权重在0.9~0.95之间
典型应用:人物三视图、负面提示词(easynegative)

低秩模型(LoRa)

Lora 的意义在于和checkpoint搭配使用,用来实现某些方面的微调
大小:比较大
文件目录:\models\Lora
后缀:.pt .safetensors(更小更安全)
应用在各种游戏、动漫角色的二次创作构建
使用时需要参考作者给出的权重参考
载入模式
提示词载入: Lora:KeQing3in1:0.5
Additional Networks:它支持你同时加载最多5个LoRA并赋予他们分别的权重
应用
[图片]

超网络(hypemetwork)

也叫做扩展模型
一般被用于改善生成图像的整体风格即改变画风。
文件目录:\models\hypernetwork
使用方法,需要在设置中选择扩展模型然后选择将hypernetwork添加到提示词
[图片]

不过hypemetwork的作用经常可以被lora替代,因此使用频率较少

重绘

当对画面大部分内容满意只需要变动小部分内容时使用重绘
有三种方式分别是:局部重绘、涂鸦重绘、上传重绘蒙版

**[图片]**

局部重绘

  1. 保持提示词不变,加上新的需求
  2. 重绘幅度调整到0.7~0.8
  3. 使用鼠标在图片上涂抹需要重绘的区域
    **[图片]**

蒙版区域内容处理不同的选项差别不大有点微妙
重绘区域选择整张图片契合度更高
预留像素类似于缓冲带,重绘区域大时适当调高
蒙版模糊类似于羽化,区域大可以适当增大,控制在10以下比较好

涂鸦重绘

该功能使用步骤和局部重绘大致一致,不过增加了调色盘按钮,可以将你涂鸦的内容也作为参考内容重绘。
[图片]

上传重绘蒙版

可以使用PS精确勾勒蒙版进行重绘

扩展

通过自带的拓展列表安装

[图片]

通过拓展仓库网址安装

[图片]

直接下包

文件路径:\extensions
每一个拓展是一个单独的文件夹

ControlNet

根据控制模型的不同,它能实现累计共14个不同方面的控制

使用流程

  1. 在图片区域导入你想要模仿的图片
  2. 选择不同的控制类型,如姿势等
  3. 点击爆炸按钮生成骨骼图
  4. 设置参数,点击启用,进行生成
    参数列表
    [图片]

**控制类型:**选择想要控制的内容
**预处理器:**不同的预处理器也会侧重不同的控制类型
**模型:**需要选择和预处理器相同的模型
**控制权重:**决定这个控制效应在图片中呈现出来的强度,默认1
**引导介入/终止时机:**图像不断扩散的过程中什么时候加入影响,开始的时间晚一点可以赋予更多的自由度
**Preprocessor Resolution:**预处理图像分辨率,在性能富裕对精度要求大时可以调高
**控制模式:**控制在提示词的影响与ControlNet的影响之间更倾向于哪一个,多数时候采纳Balanced miode
[图片]

**完美像素模式:**它可以自动计算预处理器产出图像的最适合分辨率,避免因为尺寸不合导致的图像模糊变形,推荐选中
**允许预览:**在加载想要模仿的图片时可以自动生成骨骼图

常用五大控制模型

****[图片]****

openpose:刻画手指动作与面部表情
depth:刻画景深,推荐带两个+的,尤其是带有肢体交叉的场景,甚至和OPENPOSE联合使用
canny:刻画外形,可以用在线稿上色。对于白底黑线的线稿图选用invert (from white bg& black line)处理
softedge:在使用canny太过约束时可以使用,只会保留大轮廓
scribble: 比softedge更自由奔放,可以实现灵魂画手丰富想象

多重混合模型

**[图片]**

可以使用多个ControlNet模型结合使用
更多词汇参考:
📚 学习笔记-Stable Diffusion篇
在这里插入图片描述

风格系列
lora:奇幻炫彩

1girl, fish, goldfish, solo, blue eyes, bag, japanese clothes, kimono,
profile, upper body, white hair, from side, backpack, letterboxed,
bubble, red kimono, hair ornament, bangs, floral print, blush,
underwater lora:shoal-000018:1 Negative prompt: extra fingers,fewer
fingers,(low quality, worst quality:1.65), (bad anatomy), (inaccurate
limb:1.2),bad composition, inaccurate eyes, extra digit,fewer
digits,(extra arms:1.2),nipples ENSD: 31337, Size: 448x832, Seed:
2154325080, Model: Counterfeit-V3.0_fp16, Steps: 26, Sampler: DPM++ 2M
Karras, CFG scale: 8, Clip skip: 2, Model hash: cbfba64e66, Hires
steps: 20, Hires upscale: 2, Hires upscaler: Latent (nearest-exact),
Denoising strength: 0.56

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/99064.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TensorFlow案例学习:对服装图像进行分类

前言 官方为我们提供了一个 对服装图像进行分类 的案例,方便我们快速学习 学习 预处理数据 案例中有下面这段代码 # 预处理数据,检查训练集中的第一个图像可以看到像素值处于0~255之间 plt.figure() # 创建图像窗口 plt.imshow(train_images[0]) # …

开发过程教学——交友小程序

交友小程序 1. 我的基本信息2. 我的人脉2.1 我的关注2.2 我的粉丝 3. 我的视频4. 我的相册 特别注意:由于小程序分包限制2M以内,所以要注意图片和视频的处理。 1. 我的基本信息 数据库表: 我的基本信息我的登录退出记录我的登录状态&#x…

Godot 官方2D游戏笔记(1):导入动画资源和添加节点

文章目录 前言2D官方游戏案例资源下载项目配置添加角色节点模拟运行移动根节点 结束 Godot专栏地址 前言 Godot 官方给了我们2D游戏和3D游戏的案例,不过如果是独立开发者只用考虑2D游戏就可以了,因为2D游戏纯粹,我们只需要关注游戏的玩法即可…

蓝桥杯---第二讲---二分与前缀和

文章目录 前言Ⅰ. 数的范围0x00 算法思路0x00 代码书写 Ⅱ. 数的三次方根0x00 算法思路0x01代码书写 Ⅲ. 前缀和0x00 算法思路0x01 代码书写 Ⅳ. 子矩阵的和0x00 算法思路0x01 代码书写 Ⅴ. 机器人跳跃问题0x00 算法思路0x01 代码书写 Ⅵ. 四平方和0x00 算法思路0x01 代码书写 …

SpringCloud学习笔记-注册微服务到Eureka注册中心

目录 1.在该Module的pom文件中引入eureka依赖2.在该module的src/main/resources/application.yml配置文件3.启动对应的微服务4.查看微服务是否启动成功 假如我有一个微服务名字叫user-service,我需要把它注册到Eureka注册中心,则具体步骤如下: 1.在该Module的pom文件中引入eure…

Flink的处理函数——processFunction

目录 一、处理函数概述 二、Process函数分类——8个 (1)ProcessFunction (2)KeyedProcessFunction (3)ProcessWindowFunction (4)ProcessAllWindowFunction &#xff…

真香!Jenkins 主从模式解决问题So Easy~

01.Jenkins 能干什么 Jenkins 是一个开源软件项目,是基于 Java 开发的一种持续集成工具,用于监控持续重复的工作,旨在提供一个开放易用的软件平台,使软件项目可以进行持续集成。 中文官网:https://jenkins.io/zh/ 0…

好消息:用 vue3+layui 共同铸造我们新的项目

前言: layui这个框架不知道多少人还在关注着,记得第一次接触它是在18年,后来随着vue,react的盛行,jquerylayui的模式受到了特别大的冲击,后来作者都放弃维护他的官方网站,转而在github/gitee上做…

SLAM从入门到精通(ROS和底盘Stm32的关系)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 学过Ros的同学,一般对subscribe、publish、话题、服务这些内容都比较熟悉。如果再熟悉一点的话,还会知道slam、move_base、…

NLP - 数据预处理 - 文本按句子进行切分

NLP - 数据预处理 - 文本按句子进行切分 文章目录 NLP - 数据预处理 - 文本按句子进行切分一、前言二、环境配置1、安装nltk库2、下载punkt分句器 三、运行程序四、额外补充 一、前言 在学习对数据训练的预处理的时候遇到了一个问题,就是如何将文本按句子切分&#…

ChainForge:衡量Prompt性能和模型稳健性的GUI工具包

ChainForge是一个用于构建评估逻辑来衡量模型选择,提示模板和执行生成过程的GUI工具包。ChainForge可以安装在本地,也可以从chrome浏览器运行。 ChainForge可以通过聊天节点对多个对话可以使用不同的llm并行运行。可以对聊天消息进行模板化,并…

基于复旦微JFM7K325T FPGA的高性能PCIe总线数据预处理载板(100%国产化)

PCIE711是一款基于PCIE总线架构的高性能数据预处理FMC载板,板卡采用复旦微的JFM7K325T FPGA作为实时处理器,实现各个接口之间的互联。该板卡可以实现100%国产化。 板卡具有1个FMC(HPC)接口,1路PCIe x8主机接口&#x…

【HomeKit】HAT User Manual教程

前言:这篇文章是对于苹果协议文件《HomeKit Accessory Tester (HAT) User Manual》的学习,即 HomeKit配件测试仪(HAT) 用户手册,该版本是第11次修订 第一章 概述 本文档介绍了Apple HomeKit配件测试仪(HAT)的配置和使用方法。HAT是一个Mac应…

Redis作为缓存,mysql的数据如何与redis进行同步?

Redis作为缓存,mysql的数据如何与redis进行同步? 一定要设置前提,先介绍业务背景 延时双删 双写一致性:当修改了数据库的数据也要同时更新缓存的数据,缓存和数据库的数据要保持一致 读操作:缓存命中,直接返回;缓存未…

【Spring Cloud】深入探索统一网关 Gateway 的搭建,断言工厂,过滤器工厂,全局过滤器以及跨域问题

文章目录 前言为什么需要网关以及网关的作用网关的技术实现 一、Gateway 网关的搭建1.1 创建 Gateway 模块1.2 引入依赖1.3 配置网关1.4 验证网关是否搭建成功1.5 微服务结构分析 二、Gateway 断言工厂2.1 Spring 提供的断言工厂2.2 示例:设置断言工厂 三、Gateway …

Spring的事务控制

目录 基于AOP的声明事务控制 Spring事务编程概述 搭建测试环境 基于xml声明式事务控制 详解 事务增强的AOP 平台事务管理器 Spring提供的Advice(重点介绍) 原理 (源码没有翻太明白) 基于注解声明式事务控制 基于AOP的声明…

小视频APP源码选择指南:挑选最适合你的开发框架

在如今蓬勃发展的小视频APP行业中,源码的选择是打造一款成功应用的关键步骤。然而,面对众多开发框架的选择,如何挑选最适合你的小视频APP源码呢?作为这一领域的专家,我将为你提供一份详尽的指南,助你在源码…

Windows10打开应用总是会弹出提示窗口的解决方法

用户们在Windows10电脑中打开应用程序,遇到了总是会弹出提示窗口的烦人问题。这样的情况会干扰到用户的正常操作,给用户带来不好的操作体验,接下来小编给大家详细介绍关闭这个提示窗口的方法,让大家可以在Windows10电脑中舒心操作…

智能工厂MES系统,终端设备支持手机、PDA、工业平板、PC

一、开源项目简介 源计划智能工厂MES系统(开源版) 功能包括销售管理,仓库管理,生产管理,质量管理,设备管理,条码追溯,财务管理,系统集成,移动端APP。 二、开源协议 使用GPL-3.0开…

010:连续跌3天,同时这三天收盘价都在20日均线下,第四天上涨的概率--以京泉华为例

对于《连续跌三天,压第四天上涨的盈利计算》,我们可以继续优化这个策略,增加条件:同时三天都收盘在20日均线下。 因为我们上一篇《获取20日均线数据到excel表中》获得了20日均线数据,我们可以利用均线数据来编写新的脚…