table Diffusion 的Web 用户界面简介

引言:

Stable Diffusion是一个AI 绘图软件 (开源模型),可本地部署,可切换多种模型,且新的模型和开源库每天都在更新发布,最重要的是免费,没有绘图次数限制。

Stable Diffusion 的 Web 界面,使用 Gradio 库实现。

特征

Detailed feature showcase with images:

  • 原始 txt2img 和 img2img 模式
  • 一键安装并运行脚本(但您仍然必须安装 python 和 git)
  • 外画
  • 修复
  • 彩色素描
  • 提示矩阵
  • 稳定扩散高档
  • 注意,指定模型应更加注意的文本部分
    • 穿A的男人-会更加注意燕尾服((tuxedo))
    • A Man in a - 替代语法(tuxedo:1.21)
    • 选择文本并按 或(如果您使用的是 MacOS,则按 或 或)自动调整对所选文本(匿名用户提供的代码)的关注Ctrl+UpCtrl+DownCommand+UpCommand+Down
  • 环回,多次运行 img2img 处理
  • X/Y/Z 图,一种绘制具有不同参数的图像的 3 维图的方法
  • 文本反转
    • 拥有任意数量的嵌入,并使用您喜欢的任何名称
    • 使用多个嵌入,每个令牌具有不同数量的向量
    • 适用于半精度浮点数
    • 8GB 上的火车嵌入(也有 6GB 工作的报告)
  • “附加功能”选项卡,其中包含:
    • GFPGAN,修复人脸的神经网络
    • CodeFormer,作为GFPGAN替代品的人脸修复工具
    • RealESRGAN,神经网络升频器
    • ESRGAN,具有许多第三方模型的神经网络升频器
    • SwinIR 和 Swin2SR(见此处),神经网络升频器
    • LDSR, 潜伏扩散超分辨率升频
  • 调整宽高比选项的大小
  • 取样方法选择
    • 调整采样器 eta 值(噪声倍增器)
    • 更高级的噪音设置选项
  • 随时中断处理
  • 支持 4GB 显卡(也有 2GB 工作的报告)
  • 批次的正确种子
  • 实时提示令牌长度验证
  • 生成参数
    • 用于生成图像的参数将与该图像一起保存
    • 在 PNG 块中用于 PNG,在 EXIF 中用于 JPEG
    • 可以将图像拖拽到PNG信息选项卡以恢复生成参数并自动复制到UI中
    • 可以在设置中禁用
    • 将图像/文本参数拖放到提示框
  • 读取生成参数按钮,将提示框中的参数加载到 UI
  • “设置”页面
  • 从 UI 运行任意 python 代码(必须运行才能启用)--allow-code
  • 大多数 UI 元素的鼠标悬停提示
  • 可以通过文本配置更改 UI 元素的默认值/混合值/最大值/步长值
  • 平铺支持,一个复选框,用于创建可以像纹理一样平铺的图像
  • 进度条和实时图像生成预览
    • 可以使用单独的神经网络来生成预览,几乎不需要 VRAM,也不需要计算
  • 否定提示,一个额外的文本字段,允许您列出您不想在生成的图像中看到的内容
  • 样式,一种保存部分提示并稍后通过下拉列表轻松应用它们的方法
  • 变体,一种生成相同图像但差异微小的方法
  • 种子调整大小,一种生成相同图像但分辨率略有不同的方法
  • CLIP询问器,一个试图从图像中猜测提示的按钮
  • 提示编辑,一种改变提示中代的方法,比如说开始做一个西瓜,中途切换到动漫女孩
  • 批处理,使用img2img处理一组文件
  • Img2img 替代,反向欧拉交叉注意力控制法
  • Highres Fix,一个方便的选择,只需单击一下即可生成高分辨率图片,而不会出现常见的失真
  • 动态重新加载检查点
  • 检查点合并,一个选项卡,允许您将最多 3 个检查点合并为一个
  • 具有许多来自社区的扩展的自定义脚本
  • Composable-Diffusion,一种同时使用多个提示的方法
    • 使用大写字母分隔提示AND
    • 还支持提示的权重:a cat :1.2 AND a dog AND a penguin :2.2
  • 提示没有令牌限制(原始稳定扩散允许您使用多达 75 个令牌)
  • DeepDanbooru 集成,为动漫提示创建 danbooru 样式标签
  • xformers,选择卡的主要速度提升:(添加到命令行参数)--xformers
  • 通过扩展:历史选项卡:在UI中方便地查看,定向和删除图像
  • “永久生成”选项
  • “培训”选项卡
    • 超网络和嵌入选项
    • 预处理图像:裁剪、镜像、使用 BLIP 或 deepdanbooru 自动标记(用于动漫)
  • 剪辑跳过
  • 超网络
  • Loras(与超网络相同,但更漂亮)
  • 一个单独的 UI,您可以在其中选择,预览,哪些嵌入、超网络或 Loras 添加到您的提示中
  • 可以从设置屏幕选择加载不同的VAE
  • 进度条中的预计完成时间
  • 应用程序接口
  • 支持RunwayML的专用修复模型
  • via extension:美学渐变,一种通过使用剪辑图像嵌入生成具有特定美学的图像的方法(实现 https://github.com/vicgalle/stable-diffusion-aesthetic-gradients)
  • Stable Diffusion 2.0 支持 - 有关说明,请参阅 wiki
  • Alt-Diffusion 支持 - 有关说明,请参阅 wiki
  • 现在没有任何不好的字母!
  • 以安全张量格式加载检查点
  • 放宽分辨率限制:生成的图像尺寸必须是 8 的倍数,而不是 64
  • 现在有了许可证!
  • 从设置屏幕对 UI 中的元素重新排序
  • Segmind Stable Diffusion 支持

安装和运行

确保满足所需的依赖项,并按照以下说明进行操作:

  • NVidia(推荐)
  • AMD公司GPU。
  • Intel CPU、Intel GPU(集成和独立)(外部 wiki 页面)

或者,使用在线服务(如 Google Colab):

  • 在线服务列表

使用发布包在 Windows 10/11 上使用 NVidia-GPU 进行安装

  1. 从 v1.0.0-pre 下载并解压其内容。sd.webui.zip
  2. 跑。update.bat
  3. 跑。run.bat

有关详细信息,请参阅在 NVidia-GPU 上安装和运行

在 Windows 上自动安装

  1. 安装 Python 3.10.6(较新版本的 Python 不支持 torch),选中“将 Python 添加到 PATH”。
  2. 安装 git。
  3. 下载 stable-diffusion-webui 存储库,例如通过运行 .git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
  4. 以普通、非管理员、用户身份从 Windows 资源管理器运行。webui-user.bat

在 Linux 上自动安装

  1. 安装依赖项:
# Debian-based:
sudo apt install wget git python3 python3-venv libgl1 libglib2.0-0
# Red Hat-based:
sudo dnf install wget git python3 gperftools-libs libglvnd-glx 
# openSUSE-based:
sudo zypper install wget git python3 libtcmalloc4 libglvnd
# Arch-based:
sudo pacman -S wget git python3
  1. 导航到要安装 webui 的目录,然后执行以下命令:
wget -q https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh
  1. 运行:webui.sh
  2. 检查选项。webui-user.sh

安装在 Apple 芯片上

Mac 用户:请提供反馈,说明这些说明是否适合您,以及是否有任何不清楚的地方,或者您仍然遇到此处当前未提及的安装问题。

重要提示

目前,Web UI中的大多数功能都可以在macOS上正常工作,最值得注意的例外是CLIP询问器和训练。虽然训练似乎确实有效,但它非常慢,并且消耗了过多的内存。可以使用 CLIP 询问器,但它无法与 macOS 使用的 GPU 加速一起正常工作,因此默认配置将完全通过 CPU 运行它(速度很慢)。

众所周知,大多数采样器都可以工作,唯一的例外是使用 Stable Diffusion 2.0 模型时的 PLMS 采样器。在 macOS 上使用 GPU 加速生成的图像通常应与具有相同设置和种子的 CPU 上生成的图像匹配或几乎匹配。

自动安装

新安装:
  1. 如果未安装 Homebrew,请按照 https://brew.sh 中的说明进行安装。保持终端窗口打开状态,然后按照“后续步骤”下的说明将 Homebrew 添加到您的 PATH 中。
  2. 打开新的终端窗口并运行brew install cmake protobuf rust python@3.10 git wget
  3. 通过运行克隆 Web UI 存储库git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
  4. 将要使用的 Stable Diffusion 模型/检查点放入 。如果您没有,请参阅下面的下载稳定扩散模型。stable-diffusion-webui/models/Stable-diffusion
  5. cd stable-diffusion-webui,然后运行 Web UI。将使用 venv 创建和激活 Python 虚拟环境,并自动下载和安装任何剩余的缺失依赖项。./webui.sh
  6. 若要稍后重新启动 Web UI 进程,请再次运行。请注意,它不会自动更新 Web UI;若要更新,请在运行之前运行。./webui.shgit pull./webui.sh
现有安装:

如果您有使用 创建的 Web UI 的现有安装,请从文件夹中删除该文件和文件夹。然后运行以更新 Web UI,然后运行它。setup_mac.shrun_webui_mac.shrepositoriesstable-diffusion-webuigit pull./webui.sh

下载稳定扩散模型

如果您没有任何模型可以使用,可以从 Hugging Face 下载 Stable Diffusion 模型。要下载,请单击模型,然后单击标题。查找带有“.ckpt”或“.safetensors”扩展名的文件,然后单击文件大小右侧的向下箭头进行下载。Files and versions

一些流行的官方 Stable Diffusion 模型是:

  • 稳定扩散 1.4 (sd-v1-4.ckpt))
  • 稳定扩散 1.5 (v1-5-pruned-emaonly.ckpt))
  • 稳定扩散 1.5 修复 (sd-v1-5-inpainting.ckpt)

Stable Diffusion 2.0 和 2.1 需要模型和配置文件,生成图像时需要将图像宽度和高度设置为 768 或更高:

  • 稳定扩散 2.0 (768-v-ema.ckpt)
  • 稳定扩散 2.1 (v2-1_768-ema-pruned.ckpt))

对于配置文件,按住键盘上的选项键并单击此处下载(它可以下载为)。在 Finder 中,选择该文件,然后转到菜单并选择>。在出现的窗口中,选择文件名并将其更改为模型的文件名,但文件扩展名而不是 ,按键盘上的回车键(如果出现提示,请确认更改文件扩展名),并将其放在与模型相同的文件夹中(例如,如果您下载了模型,请将其重命名为并将其与模型一起放入)。v2-inference-v.yamlv2-inference-v.yaml.ymlFileGet Info.yaml.ckpt768-v-ema.ckpt768-v-ema.yamlstable-diffusion-webui/models/Stable-diffusion

此外,还提供 Stable Diffusion 2.0 深度模型 (512-depth-ema.ckpt)。通过按住键盘上的选项并单击此处下载配置文件,然后以与上述相同的方式使用扩展名重命名它并将其与模型一起放入。请注意,此模型适用于宽度/高度为 512 或更高的图像尺寸,而不是 768。v2-midas-inference.yaml.yamlstable-diffusion-webui/models/Stable-diffusion

故障 排除

Web UI 无法启动:

如果在尝试启动 Web UI 时遇到错误,请尝试从文件夹中删除 and 文件夹,然后在再次运行之前更新 Web UI。./webui.shrepositoriesvenvstable-diffusion-webuigit pull./webui.sh

性能不佳:

目前,macOS 上的 GPU 加速会占用大量内存。如果性能较差(如果使用任何采样器生成 512x512 图像需要 20 个步骤超过一分钟)

  • 尝试从命令行选项(即 )开始,看看是否有帮助。--opt-split-attention-v1./webui.sh --opt-split-attention-v1
  • 没有太大区别吗?
    • 打开位于 /Applications/Utilities 中的 Activity Monitor 应用程序,并在“内存”选项卡下检查内存压力图。生成图像时,内存压力以红色显示
    • 关闭 Web UI 进程,然后添加命令行选项(即 )。--medvram./webui.sh --opt-split-attention-v1 --medvram
  • 该选项的性能仍然很差,内存压力仍然很红?
    • 尝试(即)。--lowvram./webui.sh --opt-split-attention-v1 --lowvram
  • 使用任何采样器生成 512x512 图像仍然需要几分钟以上的时间,其中包含 20 个步骤?
    • 您可能需要关闭 GPU 加速。
      • 在 Xcode 中打开webui-user.sh
      • 更改为 .#export COMMANDLINE_ARGS=""export COMMANDLINE_ARGS="--skip-torch-cuda-test --no-half --use-cpu all"

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/775855.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

「DevExpress中文教程」如何将DevExtreme JS HTML编辑器集成到WinForms应用

在本文中我们将演示一个混合实现:如何将web UI工具集成到WinForms桌面应用程序中。具体来说,我们将把DevExtreme JavaScript WYSIWYG HTML编辑器(作为DevExtreme UI组件套件的一部分发布的组件)集成到Windows Forms应用程序中。 获取DevExtreme v23.2正式…

2024最新版克魔助手抓包教程(9) - 克魔助手 IOS 数据抓包

引言 在移动应用程序的开发中,了解应用程序的网络通信是至关重要的。数据抓包是一种很好的方法,可以让我们分析应用程序的网络请求和响应,了解应用程序的网络操作情况。克魔助手是一款非常强大的抓包工具,可以帮助我们在 Android …

远程todesk 和向日葵连接ubuntu无法连接

问题 今天远程用todesk 和向日葵连接对方ubuntu22.04 LTS的 电脑,无法连接,一开始以为是防火墙问题,后来发现不是,找了半天资料最后解决。 原因 没有安装X11桌面环境,还是原先的wayland 解决方案 ctrl alt T …

华为耳机快速配对新设备,一招搞定

耳机现在已经是我们形影不离的随身设备,如果我们碰见华为手机或平板无法连接或连接不上华为耳机(如FreeBuds、FreeLace系列及FreeClip蓝牙耳机)的问题,其实很简单,今天分享一个小妙招,帮助我们快速解决这个…

十二、Spring源码学习之finishBeanFactoryInitialization方法

finishBeanFactoryInitialization()方法 protected void finishBeanFactoryInitialization(ConfigurableListableBeanFactory beanFactory) {// Initialize conversion service for this context.//初始化上下文类型转换服务if (beanFactory.containsBean(CONVERSION_SERVICE_…

搭建机器人产业发展重要展示平台“2024南京国际机器人展览会”

2024南京国际智能机器人展览会 2024 Nanjing Intelligent Robot Expo 时间:2024年11月22-24日 地点:南京国际博览中心 南京,这座历史悠久的文化名城,如今正站在机器人产业发展的前沿。随着全球科技的飞速进步,机器人产业已经成为推动经济社…

C 语言贪吃蛇源码解析

贪吃蛇是一款经典的电子游戏,玩家控制一条不断成长的蛇,需要避免撞到自己的身体或者游戏边界,同时吃掉出现在屏幕上的食物以增长身体长度。 下面是一个简单的贪吃蛇游戏的C语言实现,使用了标准输入输出库conio.h和时间库windows.h…

数电票怎么查询真伪|发票识别接口|发票查验接口|PHP接口文档

对于财务工作者而言,发票管理是一项即繁琐又十分重要的工作,尤其是在数字化电子发票快速普及的当下,发票识别、核验、查重等工作无疑增加了财务人员的工作难度。财务人员每天都要与大量的发票打交道,人工管理模式难免会出现手动录…

C语言二叉树和堆(个人笔记)

二叉树和堆 二叉树1二叉树的概念和结构1.1特殊的二叉树1.2二叉树的性质(规定根节点的层数为1)1.3二叉树的存储结构 2.二叉树的顺序结构和实现2.1二叉树的顺序结构2.2堆的概念和结构2.3堆的实现2.4堆的应用2.4.1堆排序 2.5TOP-K问题 3.二叉树的遍历4.二叉…

追光而遇 沐光同行——锐捷网络召开2024教育行业核心合作伙伴论坛

3月21日,主题为“追光而遇 沐光同行”的2024锐捷网络教育行业核心伙伴论坛在福州启幕。论坛汇聚了教育行业的精英与合作伙伴,议题主要聚焦于教育行业的数字化转型与创新发展,以及如何通过技术驱动,构建智慧教育生态,推动教育事业的高质量发展。作为行业领先的ICT基础设施及解决…

Spring实战:采用Spring配置文件管理Bean

文章目录 一、Spring框架概述二、实战:采用Spring配置文件管理Bean(一)创建Jakarta EE项目(二)添加Spring依赖(三)创建杀龙任务类(四)创建勇敢骑士类(五&…

【No.19】蓝桥杯简单数论上|模运算|快速幂|GCD|LCM|刷题统计|RSA解密|核桃的数量(C++)

简单数论 模运算 定义:模运算为 a 除以 m 的余数,记为 a mod m,有 a mod m a % m模运算是大数运算中的常用操作。如果一个数太大,无法直接输出,或者不需要直接输出,可以把它取模后,缩小数值再…

聚观早报 | 比亚迪2023年营收;vivo X Fold3系列发布

聚观早报每日整理最值得关注的行业重点事件,帮助大家及时了解最新行业动态,每日读报,就读聚观365资讯简报。 整理丨Cutie 3月28日消息 比亚迪2023年营收 vivo X Fold3系列发布 现代汽车拟投入68万亿韩元 华为P70系列最新渲染图 苹果A1…

C语言牛客网BC-37 牛牛的圆(求面积)

题目如下 代码实现 #include<stdio.h> int main() { float r 0;float s 0;scanf("%f",&r);s 3.14*r*r;printf("%.2f",s);return 0; } 创作不易&#xff0c;点点关注&#xff0c;感谢支持&#xff01;&#xff01;&#xff01;

[BT]BUUCTF刷题第9天(3.27)

第9天&#xff08;共2题&#xff09; [护网杯 2018]easy_tornado 打开网站就是三个txt文件 /flag.txt flag in /fllllllllllllag/welcome.txt render/hints.txt md5(cookie_secretmd5(filename))当点进flag.txt时&#xff0c;url变为 http://b9e52e06-e591-46ad-953e-7e8c5f…

SAP Fiori开发中的JavaScript基础知识5 - 对象(Object)

1 背景 在本篇博客中&#xff0c;我将介绍JavaScript中对象&#xff08;Object&#xff09;的概念和用法。 2 对象 首先我们要明明确一点&#xff0c;在JavaScript中对象&#xff08;Object&#xff09;和类&#xff08;Class&#xff09;是不同的&#xff0c;它们是两个不同…

《论文阅读》PAGE:一个用于会话情绪原因蕴含基于位置感知的图模型 ICASSP 2023

《论文阅读》PAGE&#xff1a;一个用于会话情绪原因蕴含基于位置感知的图模型 ICASSP 2023 前言 简介任务定义模型构架Utterances Encoding with EmotionPosition-aware GraphCausal Classifier实验结果 前言 亲身阅读感受分享&#xff0c;细节画图解释&#xff0c;再也不用担…

极简wordpress网站模板

Pithy设计师wordpress网站模板 精练简洁的wordpress模板&#xff0c;设计师或设计工作室展示型网站模板。 https://www.jianzhanpress.com/?p6329

Clickhouse中的基本数据类型操作和引擎

一、表操作 数据类型: 注意事项&#xff1a; 1、建表写数据类型的时候&#xff0c;严格区分大小写Int32,不能写成int32 2、建表的时候&#xff0c;必须要指定表引擎 1.整数类型 2. 字符串类型 String&#xff1a;可以任意长度的。它可以包含任意的字节集&#xff0c;包含空字…

Avalonia笔记4-Rider如何添加xaml支持

在Linux Rider中&#xff0c;File Type中是有XAML文件的&#xff0c;但是新增xaml文件并不能正确的添加到项目中&#xff0c;而且就算是新增文件&#xff0c;直接命名为“XXX.xaml”&#xff0c;也是没有智能提示的。 在引用Style文件的时候&#xff0c;需要新建一个axaml的文…