【AI绘画】Stable Diffusion WebUI

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。
img

  • 推荐:kuan 的首页,持续学习,不断总结,共同进步,活到老学到老
  • 导航
    • 檀越剑指大厂系列:全面总结 java 核心技术点,如集合,jvm,并发编程 redis,kafka,Spring,微服务,Netty 等
    • 常用开发工具系列:罗列常用的开发工具,如 IDEA,Mac,Alfred,electerm,Git,typora,apifox 等
    • 数据库系列:详细总结了常用数据库 mysql 技术点,以及工作中遇到的 mysql 问题等
    • 懒人运维系列:总结好用的命令,解放双手不香吗?能用一个命令完成绝不用两个操作
    • 数据结构与算法系列:总结数据结构和算法,不同类型针对性训练,提升编程思维,剑指大厂

非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。💝💝💝 ✨✨ 欢迎订阅本专栏 ✨✨

博客目录

    • 一.简单介绍
      • 1.什么是 Stable Diffusion
      • 2.Stable Diffusion 功能
      • 3.Github 地址
      • 4.mac 上安装
    • 二.使用简介
      • 1.启动
      • 2.模型下载
      • 3.视频部署教程
    • 三.模型下载
      • 1.进入模型下载页面
      • 2.选择类型
      • 3.排序方式
      • 4.下载模型
      • 5.位置
      • 6.使用说明
    • 四.UI 介绍
      • 1.区域划分
      • 2.模型区域
      • 3.功能区域
      • 4.参数区域
      • 5.出图区域
      • 6.中文插件
    • 五.text2img
      • 1.text2img
      • 2.参数说明
    • 六.中文插件
      • 1.中文插件 Github
      • 2.扩展列表安装
      • 3.网址安装
      • 4.zip 包安装
      • 5.如何使用
      • 6.效果图
    • 七.测试使用
      • 1.访问地址
      • 2.效果

一.简单介绍

1.什么是 Stable Diffusion

Stable Diffusion Web UI 是一个基于 Stable Diffusion 的基础应用,利用 gradio 模块搭建出交互程序,可以在低代码 GUI 中立即访问 Stable Diffusion,让我们快速生成想要的图片。

2.Stable Diffusion 功能

  1. Stable Diffusion 是一个画像生成 AI,能够模拟和重建几乎任何可以以视觉形式想象的概念,而无需文本提示输入之外的任何指导
  2. Stable Diffusion Web UI 提供了多种功能,如 txt2img、img2img、inpaint 等,还包含了许多模型融合改进、图片质量修复等附加升级。
  3. 通过调节不同参数可以生成不同效果,用户可以根据自己的需要和喜好进行创作。
  4. 我们可以通过 Stable Diffusion Web UI 训练我们自己的模型,它提供了多种训练方式,通过掌握训练方法可以自己制作模型。

3.Github 地址

代码下载

stable-diffusion-webui

image-20230926004741309

4.mac 上安装

安装教程

image-20230926004812921

二.使用简介

1.启动

#从github下载源代码
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git#进入到代码根目录
cd stable-diffusion-webui#配置好python环境
我这边是使用conda安装的python=3.10.6版本#启动Stable Diffusion WebUI
./webui.sh

2.模型下载

不同的模型出图效果是不一样,根据需求下载不同的模型,达到符合自己预期的效果。以下是常用的 2 个模型下载地址。

  • huggingface
  • civitai

3.视频部署教程

视频部署教程

三.模型下载

1.进入模型下载页面

huggingface 模型

2.选择类型

选择文生图

image-20230925093246581

3.排序方式

  • Trending 趋势
  • Most Likes 最喜欢
  • Most Downloads 下载量最多
  • Recently Updated 最近更新

image-20230925093322004

4.下载模型

最好是下载.safetensors 结尾的文件

image-20230925093447659

5.位置

把下载的文件放入到/stable-diffusion-webui/models/Stable-diffusion 目录下

image-20230926005355312

6.使用说明

  • 使用时参考模型的使用说明和案例
  • 注意添加额外文件
  • 注意特殊的 prompt 提示词,图片的效果很大程度上依赖 prompt 调参

image-20230925093647816

四.UI 介绍

1.区域划分

启动界面可以大致分为 4 个区域【模型】【功能】【参数】【出图】四个区域

image-20230925111008281

2.模型区域

模型区域:模型区域用于切换我们需要的模型,模型下载后放置相对路径为/modes/Stable-diffusion 目录里面,网上下载的 safetensors、ckpt、pt 模型文件请放置到上面的路径,模型区域的刷新箭头刷新后可以进行选择。

3.功能区域

功能区域:功能区域主要用于我们切换使用对应的功能和我们安装完对应的插件后重新加载 UI 界面后将添加对应插件的快捷入口在功能区域,功能区常见的功能描述如下

  • txt2img(文生图) — 标准的文字生成图像;
  • img2img (图生图)— 根据图像成文范本、结合文字生成图像;
  • Extras (更多)— 优化(清晰、扩展)图像;
  • PNG Info — 图像基本信息
  • Checkpoint Merger — 模型合并
  • Textual inversion — 训练模型对于某种图像风格
  • Settings — 默认参数修改

4.参数区域

参数区域:根据您选择的功能模块不同,可能需要调整的参数设置也不一样。例如,在文生图模块您可以指定要使用的迭代次数,掩膜概率和图像尺寸等参数配置

5.出图区域

出图区域:出图区域是我们看到 AI 绘图的最终结果,在这个区域我们可以看到绘图使用的相关参数等信息。

6.中文插件

中文插件

五.text2img

1.text2img

text2img 是文生图,在设置页面中,您可以输入文本,选择模型并配置其他参数。文本是必需的,它将成为图像生成的依据。您可以选择预定义的模型或上传自己的模型。您还可以选择一些其他参数,例如批处理大小,生成的图像尺寸等。

2.参数说明

  • 采样方法 (Sampler):这个参数允许您选择用于生成图像的采样方法。默认情况下,该参数设置为“Eulea”,但您也可以选择“DPM++”后面的新加入选项,这个会比默认的生成的图片细节内容更加丰富些。
  • 迭代步数(Sampling steps): 这个参数允许您指定图像生成的迭代次数。较多的迭代次数可能会导致更好的图像质量,但也需要更长的时间来完成生成,默认 50 起步。
  • 宽度&高度:这个参数允许您指定图片生成的高度和宽度。较大的高度宽度需要更多的显存计算资源,这里默认 512*512 即可,需要图片放大我们可以去更多(send to extras)模块用放大算法进行图片放大。
  • 生成批次(Batch count):此参数允许您用指定模型将为每个生成的图像运行的最大迭代次数。增加这个值多次生成图片但生成的时间也会更长(有多图需要建议减少图片生成的批次改为增加单次生成图片的数量参数即可)。
  • 每批数量(Batch size):此参数允许您指定一次可以生成的最大图像数量。如果您的系统资源有限,并且需要以较小的批量生成映像,那么这可能很有用。
  • 提示词相关性(CFG Scale):此参数可以变更图像与提示符的一致程度(增加这个值将导致图像更接近你的提示,但过高会让图像色彩过于饱和,数值越小 AI 绘图发挥的自我空间越大越有可能产生有创意的结果(默认为 7)。
  • 种子数(Seed): 此参数允许您指定一个随机种子,将用于初始化图像生成过程。相同的种子值每次都会产生相同的图像集,这对于再现性和一致性很有用。如果将种子值保留为-1,则每次运行文本-图像特性时将生成一个随机种子。
  • 优化面部(Restore faces):优绘制面部图像可勾选,头像是近角时勾选貌似容易过度拟合出现虚化,适合在远角时勾选该选项。
  • 可平铺(Tiling):用于生成一个可以平铺的图像。
  • Highres. fix:使用两个步骤的过程进行生成,以较小的分辨率创建图像,然后在不改变构图的情况下改进其中的细节,选择该部分会有两个新的参数Scale latent在潜空间中对图像进行缩放。另一种方法是从潜在的表象中产生完整的图像,将其升级,然后将其移回潜在的空间。Denoising strength 决定算法对图像内容的保留程度。在 0 处,什么都不会改变,而在 1 处,你会得到一个不相关的图像;

六.中文插件

1.中文插件 Github

中文插件 github

以下有三种安装方式,都可以选择,建议选择 zip 解压缩的方式,简单快捷。

image-20230926005558796

2.扩展列表安装

此扩展可以在 Extension 选项卡里面通过加载官方插件列表直接安装

  • 点击 Extension 选项卡,点击 Avaliable 子选项卡
  • 取消勾选 localization,再把其他勾上,然后点击 橙色按钮,如下图

image-20230925102718410

zh_CN Localization 这一项的右边点击 install,等待安装完成

image-20230925102735823

3.网址安装

  • 点击 Extension 选项卡,点击 Install from URL 子选项卡
  • 复制本 git 仓库网址:
https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN
  • 粘贴进 URL 栏,点击 Install,如图
  • 安装完成

image-20230925102834032

4.zip 包安装

image-20230925102915083

解压,并把文件夹放置在 webui 根目录下的 extensions 文件夹中,放好之后应该会如下图

image-20230925102930345

5.如何使用

  • 重启 webUI 以确保扩展已经加载了
  • Settings 选项卡,点击 页面右上角橙色 Reload UI 按钮 刷新扩展列表

image-20230925103517111

Extensions 选项卡,确定已勾选本扩展 ☑️;如未勾选,勾选后点击橙色按钮启用本扩展。

image-20230925103527437

选择简体中文语言包(zh_CN)

  • Settings 选项卡中,找到 User interface 子选项

然后去页面最顶部,找到 Localization (requires restart) 小项,找到在下拉选单中选中 zh_CN (如果没有就按一下 🔄 按钮),如图

image-20230925103554716

然后按一下 页面顶部左边的 橙色 Apply settings 按钮 保存设置,再按 右边的 橙色 Reload UI 按钮 重启 webUI

image-20230925103610672

6.效果图

image-20230925103626329

七.测试使用

1.访问地址

http://127.0.0.1:7860/

2.效果

image-20230925100632182

觉得有用的话点个赞 👍🏻 呗。
❤️❤️❤️本人水平有限,如有纰漏,欢迎各位大佬评论批评指正!😄😄😄

💘💘💘如果觉得这篇文对你有帮助的话,也请给个点赞、收藏下吧,非常感谢!👍 👍 👍

🔥🔥🔥Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧!🌙🌙🌙

img

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/90625.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springboot实现ACL+RBAC权限体系

本文基于web系统的权限控制非常重要的前提下,从ALC和RBAC权限控制两个方面,介绍如何在springboot项目中实现一个完整的权限体系。 源码下载 :https://gitee.com/skyblue0678/springboot-demo 序章 一个后台管理系统,基本都有一套…

【图像处理】SIFT角点特征提取原理

一、说明 提起在OpenCV中的特征点提取,可以列出Harris,可以使用SIFT算法或SURF算法来检测图像中的角特征点。本篇围绕sift的特征点提取,只是管中窥豹,而更多的特征点算法有: Harris & Stephens / Shi–Tomasi 角点…

【面试题】2023前端面试真题之JS篇

前端面试题库 (面试必备) 推荐:★★★★★ 地址:前端面试题库 表妹一键制作自己的五星红旗国庆头像,超好看 世界上只有一种真正的英雄主义,那就是看清生活的真相之后,依然热爱生活。…

成为威胁:网络安全中的动手威胁模拟案例

不断变化的网络威胁形势要求组织为其网络安全团队配备必要的技能来检测、响应和防御恶意攻击。然而,在研究中发现并继续探索的最令人惊讶的事情是,欺骗当前的网络安全防御是多么容易。 防病毒程序建立在庞大的签名数据库之上,只需更改程序内…

《The Rise and Potential of Large Language Model Based Agents: A Survey》全文翻译

The Rise and Potential of Large Language Model Based Agents: A Surve - 基于 LLMs 的代理的兴起和潜力:一项调查 论文信息摘要1. 介绍2. 背景2.1 AI 代理的起源2.2 代理研究的技术趋势2.3 为什么大语言模型适合作为代理大脑的主要组件 3. 代理的诞生&#xff1a…

数据库系统课设——基于python+pyqt5+mysql的酒店管理系统(可直接运行)--GUI编程(2)

几个月之前写的一个项目,通过这个项目,你能学到关于数据库的触发器知识,python的基本语法,python一些第三方库的使用,包括python如何将前后端连接起来(界面和数据),还有界面的设计等…

神经辐射场(NeRF)2023最新论文及源代码合集

神经辐射场(NeRF)作为一种先进的计算机图形学技术,能够生成高质量的三维重建模型,在计算机图形学、计算机视觉、增强现实等领域都有着广泛的应用前景,因此,自2020年惊艳亮相后,神经辐射场也成为…

python安装第三方模块方法

正常情况下安装python第三方模块没啥说的,但是由于python安装模块默认是在外网下载安装,牵扯外网网速问题,所以可以配置下使用国内某镜像源来下载模块 python -m pip install xxxxxxxxxxx 和 pip install xxxxxxxxxx 的命令都可下载安装第三…

raw智能照片处理工具DxO PureRAW mac介绍

DxO PureRAW Mac版是一款raw智能照片处理工具,该软件采用了智能技术,以解决影响所有RAW文件的七个问题:去马赛克,降噪,波纹,变形,色差,不想要的渐晕,以及缺乏清晰度。 Dx…

李宏毅机器学习第一课(结尾附作业模型详细分析)

机器学习就是让机器找一个函数f,这个函数f是通过计算机找出来的 如果参数少的话,我们可以使用暴搜,但是如果参数特别多的话,我们就要使用Gradient Descent Regression (输出的是一个scalar数值) Classification (在…

【C++】C++入门

一、C 关键字(C98) C 总计 63 个关键字,C 语言 32 个关键字。C 语言的关键字在 C 中继续可以使用。 C 兼容 C 的绝大多数语法。 二、命名空间 在 C / C 中,变量、函数和类都是大量存在的,这些变量、函数和类的名称将都…

DVWA-impossible代码审计

本篇文章针对于DVWA靶场的impossible级别进行代码审计,基于DVWA的每一个漏洞的impossible级别,从整体思路上出发,进行代码审计,最后对其总结。从中可以学习到一些漏洞的防御手法,并且对漏洞有更深入的理解。 文章目录 …

led台灯哪个牌子最好?2022最新的台灯牌子排名

想要选好护眼台灯首先我们要知道什么是护眼台灯,大的方向来看,护眼台灯就是可以保护视力的台灯,深入些讲就是具备让灯发出接近自然光特性的光线,同时光线不会伤害人眼而出现造成眼部不适甚至是视力降低的照明设备。 从细节上看就…

Linux——补充点(页表映射及LWP)

目录 补充点1:进程地址空间堆区管理 补充点2:Linux内核进程上下文切换 补充点3:页表映射 补充点4:两级页表 补充点1:进程地址空间堆区管理 Linux内核通过一个被称为进程描述符的task_struct结构体来管理进程&#…

【Java 进阶篇】MySQL多表查询之外连接详解

在MySQL数据库中,多表查询是一种常见且强大的功能,允许您在多个表之间执行联接操作,从而检索、过滤和组合数据。在本篇博客中,我们将深入探讨多表查询的一种类型,即外连接(Outer Join)&#xff…

医疗小程序开发:技术门槛高?

随着移动互联网的普及,医疗行业也逐渐转向线上。医疗小程序开发成为了很多企业和医疗机构关注的焦点。但是,对于一些技术小白来说,可能会觉得医疗小程序开发技术门槛高,无从下手。实际上,使用乔拓云平台进入后台&#…

C理解(一):内存与位操作

本文主要探讨C语言的内存和为操作操作相关知识。 冯诺依曼结构和哈佛结构 冯诺依曼结构:数据和代码放在一起,便于读取和修改,安全性低 哈佛结构是:数据和代码分开存放,安全性高,读取和修麻烦 内存 内存是用来存储全局变量、局…

Prometheus+Grafana监控K8S集群(基于K8S环境部署)

文章目录 一、环境信息二、部署前准备工作三、部署Prometheus监控系统四、部署Node_exporter组件五、部署Kube_state_metrics组件六、部署Grafana可视化平台七、Grafana可视化显示Prometheus收集数据八、Grafana添加监控模板九、拓展 一、环境信息 1、服务器及K8S版本信息&…

Nim游戏

891. Nim游戏 - AcWing题库 全部异或起来&#xff0c;如果不为零&#xff0c;则可以一步使其变为0&#xff1a; 设异或和为x&#xff0c;x的最高位为第k位&#xff0c;令第k位为1的a[i]变为a[i]^x&#xff0c;a[i]^x < a[i]&#xff0c;这样就可以使异或和为0。 如此往复最…

目标检测如何演变:从区域提议和 Haar 级联到零样本技术

目录 一、说明 二、目标检测路线图 2.1 路线图&#xff08;一般&#xff09; 2.2 路线图&#xff08;更传统的方法&#xff09; 2.3 路线图&#xff08;深度学习方法&#xff09; 2.4 对象检测指标的改进 三、传统检测方法 3.1 维奥拉-琼斯探测器 (2001) 3.2 HOG探测器…