SD下载、安装、使用、卸载-Stable Diffusion整合包v4.10发布!

目录

    • 前言
      • 概述
    • SD安装
      • 1、安装软件
      • 2、启动
      • 3、配置
      • 4、运行
      • 5、测试
    • 导入SD模型【决定画风】
      • 常用模型
      • 下载安装模型
    • SD卸载
    • SD文生图
      • 提示词
      • 提示词使用技巧
      • 提示词的高级使用技巧
        • 强调关键词

前言

我向来不喜欢搞一些没有用的概念,所以直接整理可能用到的东西。

sd简单的说就是一个更据描述生成不同风格的图片的东西,与之对应的还有mj,但是我绝对不会使用他,为什么,因为收费,可以不赚钱,但是绝对不能往里搭,无非浪费一些时间而已

软件下载

  • 秋葉aaaki 唯一账号:https://space.bilibili.com/12566101

概述

Stable Diffusion模型并不是单一的文生图模型,而是多个模型组成的运作系统,其中的技术可以拆解为3个结构来看:

  • ClipText 文本编码器 :用于解析提示词的Clip模型
    • 编码器Clip ,它是由OpenAI公司开发的模型,包括文本编码和图像编码2个部分,分别用于提取文本和图像的特征,通过搜集大量网络上的图像和文字信息再对Clip模型进行训练,可以实现文本和图像的对应关系。
    • 在SD模型运作过程中,它可以提取提示词文本部分的特征传递给图像生成器,让模型理解我们输入的提示词内容,从而达到文本控制图像生成的目的。
  • Diffusion扩散模型 : 用于生成图像的U-Net 和Sche duler
    • 就是更据算法什么东西的生成图像
  • VAE模型 : 用于压缩和恢复的图像解码器
    • 相当于滤镜

SD安装

1、安装软件

在这里插入图片描述

2、启动

在这里插入图片描述

3、配置

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

4、运行

在这里插入图片描述

在这里插入图片描述

5、测试

要么直接弹窗,要么就复制控制台中的链接http://127.0.0.1:7860
打开页面后直接点击生成,看看有没有图片生成

在这里插入图片描述

导入SD模型【决定画风】

常用模型

  • Checkpoint(大模型)【常用】
    • 相当于风格滤镜,例如 油画,漫画,写实风等。
    • 需要注意的是,一些Checkpoint需要与特定的低码率编码器(Lora)配置使用,以获得更好的效果
  • VAE模型
    • 对模型的滤镜进行微调,不同的VAE右一些细节上的差异,但是不会影响输出的效果
    • 可以理解成对模型进行增强,有些模型文件已经有了VAE效果,所以不要盲目挂载,选择自动模式就行
  • embedding
    • 相当于组件。举个例子,如果我们想要生成一个开心的皮卡丘,通常需要输入很多描述词,如黄毛、老鼠、长耳朵、红等等。但是,如果引入皮卡丘的embedding,我们只需要输入两个词:皮卡丘和开心。皮卡丘的embedding打包了所有皮卡丘的特征描述,这样我们就不用每次输入很多单词来控制生成的画面了。
    • 在日常使用中,embedding技术通常用于控制人物的动作和特征,或者生成特定的画风。相比于其他模型(如LORA),embedding的大小只有几十KB,而不是几百兆或几GB,除了还原度对比lora差一些但在存储和使用上更加方便
  • LoRA模型【常用】
    • LORA与embedding在本质上类似,因为携带着大量的训练数据,所以LORA对人物和细节特征的复刻更加细腻。
    • 每个LORA模型对输出图像的权重设置是非常重要的。权重设置越大,对画面的影响因素就越浅。通常情况下,权重应该控制在0.7-1之间。如果权重过高,会大幅度影响出图的质量。
    • 为了获得最佳效果,我们可以根据不同的LORA模型选择适当的提示词和排除词,并在设置权重时进行调整。同时,我们还可以参考其他作者的经验和技巧,以便更好地利用LORA生成图像

下载安装模型

  • https://civitai.com/各类模型下载也俗称c站(不稳定,用魔法)
  • https://lexica.art/找一些风格提示词不错
  • https://www.liblib.art/

在这里插入图片描述

在这里插入图片描述

SD卸载

直接把整个文件夹删除,删除前记得把模型复制出来,以后还能用

SD文生图

Stable Diffusion基础的操作流程并不复杂

  1. 选择模型【决定画风】
  2. 选择功能(文生图)
  3. 填写提示词【主要决定画面内容】
  4. 设置参数 【设置图像的预设属性】
  5. 点击生成。
    通过操作流程就能看出,我们最终的出图效果是由 模型、提示词、参数设置 三者共同决定的,缺一不可。
    在这里插入图片描述

提示词

大家都知道,如今的AI工具大多是通过提示词来控制模型算法,那究竟什么是提示词?

对于人类而言,在经过多年的学习和使用后,我们只需简单的几句话便能轻松的沟通和交流。但如今的人工智能还是基于大模型的数据库进行学习,如果只是通过简单的自然语言描述,没有办法做到准确理解。为了更好的控制AI,人们逐渐摸索出通过反馈来约束模型的方法,原理就是当模型在执行任务的时候,人类提供正面或负面的反馈来指导模型的行为。而这种用于指导模型的信息,就被统称为 Prompt提示词。

Stable Diffusion的咒语上除了prompt(正向关键词)外,还有Negative prompt反向关键词。

  • 正向提示词用于描述想要生成的图像内容,
  • 反向关键词用于控制不想出现在图像中的内容

比如目前很多模型还无法理解的手部构造,为了避免出现变形,我们可以提前在反向关键词中输入手部相关的提示词,让绘图结果规避出现手的情况。

注意:不是zg人开发的,所以这里的提示词去翻译成英文,只需以词组形式分段输入即可,词组间使用英文逗号进行分隔。大部分情况下字母大小写和断行也不会影响画面内容,我们可以直接将不同部分的提示词进行断行,由此来提升咒语的可读性。

提示词使用技巧

当然如果每次都是想到什么输什么,画面中可能还是会缺失很多信息,这里给大家分享一下我自己平时使用的提示词公式,按顺序分别为: 主体内容、环境背景、构图镜头、图像设定、参考风格。 后续在编写咒语时可以按照一下类目对号入座,会更加规范和易读。
需要注意的是,公式只是参考,并非每次编写咒语我们都要包含所有内容,正常的流程应该是先填写主体内容看看出图效果,再根据自己的需求来做优化调整。
在这里插入图片描述

提示词的高级使用技巧

强调关键词

先来看看 强调关键词 ,这应该是使用最为频繁的语法了。强调关键词是依赖括号和数值来控制特定关键词的权重,当权重数值越高,说明模型对该关键词更加重视,在运行过程中模型就会着重绘制该部分的元素,在最终成像时图片中就会体现更多对应信息。反之数值越低,则最终图片中对应内容会展示的更少。

控制关键词的括号共有三种类型: 圆括号()、花括号{}和方括号[] ,分别表示将括号内关键词的权重调整到原有的1.1倍、1.05倍和0.9倍。其中花括号{}平时很少会使用, 一般都是用圆括号()和方括号[] 。

需要注意的是,这里括号是支持多层叠加的,每层括号都表示乘以固定倍数的权重

在这里插入图片描述
除了直接加括号外,还有一种更常用的控制权重方法,那就是直接填写数值。
在这里插入图片描述

虽然强调关键词语法支持的权重范围在0.1~100之间,但是过高和过低的权重都会影响出图效果,因此建议大家控制在 0.5~1.5 范围即可。

这里还有个快捷操作的小技巧,就是选中对应关键词后,按住 ctrl+⬆️ / ⬇️ ,可以快速增加和减少权重数值,默认每次修改0.1,可以在设置中修改默认数值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/891789.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# _ 数字分隔符的使用

总目录 一、数字分隔符是什么? _ 用作数字分隔符。可以将数字分隔符用于所有类型(二进制,十进制,十六进制)的数字文本。数字分隔符 _ 在编译时是被编译器忽略的,因此在语义上对数字结果没有任何影响。 二…

工程师了解的Lua语言

1、关于lua语言 lua语言是用于嵌入式领域当中的一门脚本语言,其实在大学期间,我也没有接触过这门语言,但是在未来的发展之路当中,需要用到这门语言,所以在我的知识库当中添加这门语言知识是必要而且重要的,…

Mac iTerm2集成DeepSeek AI

1. 去deepseek官网申请api key,DeepSeek 2. 安装iTerm2 AI Plugin插件,https://iterm2.com/ai-plugin.html,插件解压后直接放到和iTerms相同的位置,默认就在/Applications 下 3. 配置iTerm2 4. 重启iTerm2,使用快捷键呼出AI对话…

1.2.1 归并排序

归并排序原理 1) 整体就是一个简单递归, 左边排好序、 右边排好序、 让其整体有序 2) 让其整体有序的过程里用了外排序方法 3) 利用master公式来求解时间复杂度 4) 归并排序的实质 时间复杂度O(N*logN),额…

MySQL数据库笔记——多版本并发控制MVCC

大家好,这里是Good Note,关注 公主号:Goodnote,本文详细介绍MySQL的并发控制:多版本并发控制MVCC。 文章目录 背景介绍数据库并发控制——锁机制悲观锁和乐观锁悲观锁乐观锁 数据库并发控制——MVCC 的引入MVCC 和锁机…

内部类 --- (寄生的哲学)

内部类总共有 4 种(静态内部类、非静态内部类、局部内部类、匿名内部类) 作用: 一:内部类提供了更好的封装,可以把内部类隐藏在外部类之内,不允许同一个包中的其他类访问该类。 二:内部类可以…

电脑里msvcr120.dll文件丢失怎样修复?

电脑里msvcr120.dll文件丢失的修复指南 在电脑的日常使用中,我们可能会遇到各种各样的系统文件丢失问题,其中msvcr120.dll文件的丢失就是较为常见的一种。作为一名在软件开发领域深耕多年的从业者,我将为大家详细解析msvcr120.dll文件的重要…

今日头条ip属地根据什么显示?不准确怎么办

在今日头条这样的社交媒体平台上,用户的IP属地信息对于维护网络环境的健康与秩序至关重要。然而,不少用户发现自己的IP属地显示与实际位置不符,这引发了广泛的关注和讨论。本文将深入探讨今日头条IP属地的显示依据,并提供解决IP属…

理解linux内核中的几种地址

1. 前言 《Linux内核完全注释》这本书提到了几种Linux内核中的几种地址,实地址,有虚拟地址,逻辑地址,线性地址,物理地址。除了物理地址以外,其他几种容易弄混淆。这里做一下笔记,讲一下我的理解…

【Rust自学】10.3. trait Pt.1:trait的定义、约束与实现

喜欢的话别忘了点赞、收藏加关注哦,对接下来的教程有兴趣的可以关注专栏。谢谢喵!(・ω・) 题外话:trait的概念非常非常非常重要!!!整个第10章全都是Rust的重难点!&#x…

Java List 集合详解:基础用法、常见实现类与高频面试题解析

正文 在 Java 集合框架中,List 是一个非常重要的接口,广泛用于存储有序的元素集合。本文将带你深入了解 List 接口的基本用法、常见实现类及其扩展,同时通过实际代码示例帮助你快速掌握这些知识。 👉点击获取2024Java学习资料 1…

大白话拆解——多线程中关于死锁的一切(七)(已完结)

前言: 25年初,这个时候好多小伙伴都在备战期末 小编明天还有一科考试,日更一篇,今天这篇一定会对小白非常有用的!!! 因为我们会把案例到用代码实现的全过程思路呈现出来!&#xff…

ROS节点架构设计:提高模块化与可扩展性

在 ROS2(Robot Operating System 2)的开发中,节点的架构设计是构建高效、稳定和可扩展机器人系统的基石。一个设计良好的节点架构不仅有助于提升系统的模块化水平,还能极大地增强代码的可维护性。本文将深入探讨 ROS2 中的三种常见…

GitLab集成Runner详细版--及注意事项汇总【最佳实践】

一、背景 看到网上很多用户提出的runner问题其实实际都不是问题,不过是因为对runner的一些细节不清楚导致了误解。本文不系统性的介绍GitLab-Runner,因为这类文章写得好的特别多,本文只汇总一些常几的问题/注意事项。旨在让新手少弯路。 二、…

《数据结构》期末考试测试题【中】

《数据结构》期末考试测试题【中】 21.循环队列队空的判断条件为?22. 单链表的存储密度比1?23.单链表的那些操作的效率受链表长度的影响?24.顺序表中某元素的地址为?25.m叉树第K层的结点数为?26. 在双向循环链表某节点…

「Mac畅玩鸿蒙与硬件54」UI互动应用篇31 - 滑动解锁屏幕功能

本篇教程将实现滑动解锁屏幕功能,通过 Slider 组件实现滑动操作,学习事件监听、状态更新和交互逻辑的实现方法。 关键词 滑动解锁UI交互状态管理动态更新事件监听 一、功能说明 滑动解锁屏幕功能包含以下功能: 滑动解锁区域:用…

螺栓松动丢失腐蚀生锈检测数据集VOC+YOLO格式504张4类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):504 标注数量(xml文件个数):504 标注数量(txt文件个数):504 标注…

Postman测试big-event

报错500。看弹幕,知道可能是yml或sql有问题。 所以检查idea工作台, 直接找UserMapper检查,发现完全OK。 顺着这个error发现可能是sql有问题。因为提示是sql问题,而且是有now()的那个sql。 之后通过给的课件,复制课件…

如何使用大语言模型进行事件抽取与关系抽取

诸神缄默不语-个人CSDN博文目录 文章目录 1. 什么是事件抽取与关系抽取?2. 示例:使用大语言模型进行事件抽取与关系抽取 1. 什么是事件抽取与关系抽取? 事件抽取是指从文本中识别出与某些“事件”相关的信息。这些事件通常包括动作、参与者、…

NAT网络技术

NAT(Network Address Translation,网络地址转换)是一种常用的网络技术,主要用于在私有网络和公共网络之间转换IP地址。在家庭和小型企业网络当中用的比较多。它的主要功能有IP地址重用和增强网络的安全性。   NAT允许一个整个网…