无码高清?Stable DIffusion教程 | 如何利用 Stable Diffusion webui 将图片变得更清晰?全方位对比4种放大方法!

大家好,我是大师兄

1、引言

“高分放大”(有时候也叫“超分放大”或“高清修复”)描述了在确保图像清晰度的前提下提升图片分辨率的过程。例如,将一张512 x 512的图片放大四倍,得到的就是2048 x 2048分辨率的图片,这个过程不仅放大了图片尺寸,也丰富了图像细节以保持图像清晰度。

在SD webui中,直接生成一张2048 x 2048分辨率的图片由于模型底层机制的限制而变得极其困难。这主要有以下3个原因:

1、显存限制: 与512 x 512相比,2048 x 2048的像素点数量增长16倍,生成图片所需的内存也随之增长16倍。基本上,运行SD webui会占用约3G的显存,处理512 x 512分辨率的图像,显存使用将增加约1G。因此,若要直接生成2048x2048的图片,需要约20G的显存,而当前主流显卡通常只配备8G甚至4G的内存,无法支撑生成高分辨率图片。

2、时间限制: 随着显存使用的增加,生成时间也会以指数级别增长,达到正常时间的16倍!

3、模型限制: 用于训练模型的图片分辨率最高为768 x 768,直接生成过高分辨率的图片可能会导致模型产生重复元素的图片,如重复的人物或头部等。

因此,若想获取一张高分辨率的图片,通常需要进行以下步骤:

1、生成一张低分辨率的图片,例如512 x 512、768 x 512、或512 x 768。

2、然后选择合适的方法放大图片。

下面正式开始介绍本期的内容。

2、插件下载和安装

想要使用高分放大功能,需要借助一些插件的帮助。如果你打算按照这个教程进行操作,那么我建议你安装以下插件。每种插件都提供了三种安装方法,请根据需要自行选择。

1、Ultimate SD Upscale 插件安装

Ultimate SD upscale(终极SD放大) 与 SD webui 内置的放大插件类似,只是 Ultimate SD Upscale 插件提供了更多高级选项。

安装该插件的方法有以下3种。

其中第1种和第2种需要魔法,第3种国内网络即可完成

1)通过SD webui 内部安装

① 打开SD webui,点击 extensions(插件),点击 install from URL(从网址安装)

② 在第一行框内输入:https://github.com/Coyote-A/ultimate-upscale-for-automatic1111 (注意需要科学上网)

③ 点击 install(安装)

④ 等待安装完成,然后重启SD webui

⑤ 如果安装成功,你可以在 img2img 标签页的 script(脚本)框的下拉菜单中找到该插件。

2)手动安装

① 下载 Ultimate SD upscale 原文件,下载地址有以下两个,选择其中一个下载:

从 github 下载:https://github.com/Coyote-A/ultimate-upscale-for-automatic1111/archive/refs/heads/master.zip
(如无法下载,请看文末扫描获取)

② 解压文件,并将 ultimate-upscale-for-automatic1111 文件夹转移到 stable-diffusion-webui\extensions 路径下

③ 重启 SD webui,如果安装成功,你可以在 img2img 标签页的 script(脚本)框的下拉菜单中找到该插件。

2、ControlNet 插件安装及模型下载

ControlNet 是 SD webui 中功能非常强大的插件,提供了许多控制图片生成效果的方法。在这个教程中我将利用 ControlNet 对图片进行高分放大。

sd webui 的插件安装基本都是异曲同工的,安装步骤完全相同,因此下面的安装方法将不再配图。

手动安装

① 下载 ControlNet 原文件,下载地址有以下两个,选择其中一个下载:

从 github 下载:https://github.com/Mikubill/sd-webui-controlnet/archive/refs/heads/main.zip (如无法下载,请看文末扫描获取)

② 解压文件,并将 sd-webui-controlnet 文件夹转移到 stable-diffusion-webui\extensions 路径下

③ 重启 SD webui,如果安装成功,你可以在 txt2img 标签页中找到该插件。

ControlNet 模型下载:

不同于其他插件,ControlNet 的运作还需要下载它独有的模型。

① 打开ControlNet 模型下载地址:https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main (如无法获取请看文末扫描获取)

② 此网址包含了所有可下载的 ControlNet模型,你可以下载所有 .pth 结尾的文件,但这个教程只会使用到其中的 tile 模型,该模型下载链接:https://huggingface.co/lllyasviel/ControlNet-v1-1/resolve/main/control_v11f1e_sd15_tile.pth,你也可以只下载这个模型,后续有需要再下载其它模型。

③ 将下载的模型放在 stable-diffusion-webui\extensions\sd-webui-controlnet\models 目录下

④ 重启 SD webui,如果安装成功,你应该可以在如下位置找到 tile 模型

生成输入图片

图片的生成参数如下:

模型:ChilloutMix

模型下载链接:

https://huggingface.co/swl-models/chilloutmix/resolve/main/Chilloutmix-non-ema-fp16.safetensors
(如无法下载请看文末扫描获取)

下载的模型移动到 stable-diffusion-webui\models\Stable-diffusion 路径下。

图片生成参数:

    Prompt(正向提示词):raw photo, high quality, 1 girl, young, (detailed clear eyes:1.2), radiant skin, white dress, pink short hair, swept bangs, (collorbone:1.1), slim, perfect nose, (pink lip:1.1), highly detailed, flowering land as background, expansive view, upper body, sunlight, side light, (cinematic lighting:1.1), bright color, dramatic, fantasy, stunningly beautiful,8k, uhd,

    Negative prompt(反向提示词):nsfw, naked, asymmetric eyes,out of frame, abnormal face, ugly, deformed, distorted, (easynegative:1.2), low contrast, (Pale skin:1.2),open mouth

其它参数:

Sampling method(采样方法):DMP++ 2M Karras

Sampling steps(采样步数):20

Size(尺寸):768 x 512

CFG scale(CFG值):7

Seed(种子):4263532296

Clip skip:2

获得如下图片:

下面的示例都将以此图作为输入进行测试。

高分放大方法

1、Hires. Fix

这个高清修复的方法我简单概述一下这个方法的优缺点:

缺点: 这种方法对显存的占用较高,处理时间较长,且会放大生成的每一张图片。然而,有些图片可能并无需放大,因此这种方法的效率偏低,不是特别推荐使用。(以我的4G显存为例,是无法运行的,高显存请随意)

优点: 有独有的放大算法

接下来,我们将深入探讨另外三种高清修复的方法。

2、AI Upscaler(AI放大法)

AI放大法是 SD webui 中非常基础的一种高分放大方法,操作最简单。这种方法需要使用到AI 放大模型,在 SD webui 中已经内置了几种AI放大模型,如 4xESRGAN、R-ESRGAN 4x+ 和 Lanczos 等等。

更多AI放大模型可以从这个网址下载:https://upscale.wiki/wiki/Model_Database

将下载的模型放在 stable-diffusion-webui/models/ESRGAN 路径下即可。

下面介绍操作步骤。

① 进入 SD webui,点击 Extra(后期处理)标签页

② 拖拽或者上传一张照片到图片框内

③ 改变 Scale by 下的 Resize(调整大小)可以调整放大倍率,默认4倍即可。Scale to 可以放大图片到指定大小

④ 在 Upscaler 1(放大算法1)的下拉菜单中选择 4xESRGAN 4x+,Upscaler 2(放大算法2)选择 4x_CountryRoads_377000_G(这个模型需要自行安装),Upscaler 2 visibility(放大算法2能见度)设置为0.5。由于这张图片的人脸正常,其它设置保持默认

⑤ 点击 Generate(生成),生成图片如下

先来对比一下脸部细节

完全保留了原图的该有的样子,而且清晰度提升非常显著,保留了人脸皮肤的质感。但是会产生一些不太自然的现象,比如眼睛部分,瞳孔模糊,眼角异常。

再来看看其他衣服细节:

可以看出,使用AI放大法对图片进行高分放大后的效果是相当不错的,能够完全保留原图信息,而不做更改。

总结一下AI放大的优缺点

优点: 处理时间非常短,占用内存少,不改变原图的内容

缺点: 有较为明显的人工痕迹,且无法处理瑕疵

使用技巧:

1、多试几个放大算法,选择最合适的

2、如果内置的放大算法不能满足你的要求,那么可以下载新的放大算法。

3、Ultimate SD Upscale(终极SD放大法)

在使用AI放大法的时候,可以观察到,放大后的结果是完全忠于输入的图像的,也就是说当你觉得生成的图片已经足够完美了,你不想有任何一点点改动,那么AI放大法是一个很好的高分放大法。

但是如果生成的图片不是那么完美,你希望在放大的时候对其稍微改善,那么终极SD放大法会是一种很不错的方法。

操作步骤:

① 在 txt2img 标签页,点击send to img2img。如果是存在本地的图片,那么先上传到 PNG info 界面,然后再点击 send to img2img。

② 设置 Denoising strength(重绘幅度)为0.25。此值需要根据实际情况选择数值。如果不想让图片有过多的变化,可以使用0.1-0.2的重绘幅度。重绘幅度越大,图片的变化越大,但不能超过0.5。其它保持默认设置,设置好后的界面如下

③ 在 script(脚本)框内选择 Ultimate SD Upscale,其它设置按照下图方式设置

④ 保持 tile width 为512,tile height 为0,此设置会使图片按512x512的大小分别处理

⑤ 点击 Generate(生成),生成图片如下

先来看看脸部细节

效果还是相当不错的,会去除一些瑕疵,比如人脸上的痣,瞳孔也更正常。不过磨皮效果有点过强了,同时眼角还是有点泛白。

再来看一下衣服细节:

总的来说 Ultimate SD Upscale 插件的效果非常不错。在处理复杂图片信息时,终极SD放大法的效果会更为突出

总结一下优缺点

优点: 能够简单处理瑕疵,与SD放大法相比能够添加更多的细节。

缺点: 处理时间相比AI放大法更长,对瑕疵的处理程度还不够强

4、ControlNet tile upscale(瓦片放大法)

这种高分放大方法为进阶方法,需要 ControlNet 和 Ultimate SD Upscale 两种插件的共同参与。

瓦片放大法具有两个比较突出的优点:1、能给原始图片添加更多的细节;2、显存占用低,因此可以绘制分辨率更高的图。

具体的操作步骤如下:

① 在 txt2img 标签页,点击send to img2img。如果是存在本地的图片,那么先上传到 PNG info 界面,然后再点击 send to img2img。

设置 Sampling steps(迭代步数)为20,如果要添加更多细节,可以适当增加迭代步数

设置 Denoising strength(重绘幅度)为0.4,值越大图片的变化越大,反之亦然

打开 ControlNet 界面,将待处理图片上传上去

② 勾选上 Enable(启用),显存小的显卡勾选 Low VRAM(低显存模式),勾选Pixel perfect(完美像素模式)

③ Preprocessor(预处理器)选择 tile_resample(分块重采样)

④ Model(模型)选择 control_v11f1e_sd15_tile,设置好后的界面如下:

⑤ Script(脚本)选择 Ultimate SD upscale,其它设置如下

⑥ 点击 Generate(生成)

先来看看脸部细节对比

只能说效果相当炸裂!注意下眼皮的纹理,瞳孔的纹理,嘴唇的褶皱,细节完全拉满!

再看一下衣服细节

总结一下优缺点

优点: 给图片添加更多细节,是三种方法中效果最好的

缺点: 处理时间更长,是三种方法中最长的

5、总结

下面综合对比以上三种方法生成的效果

人脸部分:

衣服部分:

以下是我对三种方法的个人打分,相对直观的反应了3种高分放大方法的使用体验。

总的来说,无论是使用 Ultimate SD upscale 还是 ControlNet + Ultimate SD upscale 进行放大,其处理时间都会远远大于AI放大法,相应的效果也会更好。而普通的SD放大能真实的还原图片原本信息,不做修改,而且处理时间很短,但也意味着会放大图片本身存在的下次。

具体应该选择哪种方法,就需要根据个人情况自行选择了。

好啦,本期的内容到这里就结束了!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/24394.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

暂停系统更新

电脑左下角搜索注册表编辑器 计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\WindowsUpdate\UX\Settings 找到这个目录 打开FlightSettingsMaxPauseDays,没找到的话就创建一个同名文件夹然后选择10进制填入3550​​​​​​​ 最后进入系统暂停更新界面选择最下面…

英伟达Blackwell芯片正式投入生产 | 百能云芯

在近日的一场公开活动中,英伟达公司的创始人和首席执行官黄仁勋正式宣布,备受瞩目的Blackwell芯片已成功投产。 黄仁勋在讲话中强调,英伟达将继续坚持其数据中心规模、一年节奏、技术限制、一个架构的战略方向。这意味着英伟达将继续运用业界…

1000Base-T协议解读

一、说明 千兆以太网家族包括1000Base-SX(短距)、1000Base-LX(长距)、1000Base-CX(铜缆短距)、1000Base-T1(车载以太网)和1000Base-T等多种标准,我们这边主要了解下1000Base-T,也就是工业千兆以太网,PC电脑的网口都是这个。 1000Base-T采用了4D-PAM5编码技术(4D代…

Java Web学习笔记4——HTML、CSS

HTML: HTML:超文本标记语言。 超文本:超越了文本的限制,比普通文本更强大。除了文字信息,还可以定义图片、音频、视频等内容。 标记语言:有标签构成的语言。 HTML标签都是预定义好的,例如&a…

C++中的字符串详解

在C中,字符串处理可以通过多种方式实现,主要包括C风格字符串(C-style strings)和C标准库提供的std::string类。下面对这两种字符串进行详细解释。 C风格字符串 C风格字符串是以null字符(\0)结尾的字符数组…

css网格背景样式

空白内容效果图 在百度页面测试效果 ER图效果 注意&#xff1a;要给div一个宽高 <template><div class"grid-bg"></div> </template><style scoped> .grid-bg {width: 100%;height: 100%;background: url(data:image/svgxml;base…

MySQL数据库数据恢复方案应对没有where误操作导致的大量数据更新或删除

&#x1f604; 19年之后由于某些原因断更了三年&#xff0c;23年重新扬帆起航&#xff0c;推出更多优质博文&#xff0c;希望大家多多支持&#xff5e; &#x1f337; 古之立大事者&#xff0c;不惟有超世之才&#xff0c;亦必有坚忍不拔之志 &#x1f390; 个人CSND主页——Mi…

使用 ISIC 快速申请 JetBrain 学生免费产品

此篇文章适合急需通过学生优惠使用 JetBrain 产品并且愿意花费 50 &#xff08;申请国际电子学生证 ISIC 需要 50&#xff09;的学生。需要等待时间1-3天&#xff0c;主要是等待 ISIC 的时间&#xff0c;只要 ISIC 发放 ISIC name 和 ISIC ID&#xff0c;将其填写到 JetBrain 的…

Oracle 收缩表高水位线

Oracle 收缩表高水位线节省空间 1、模拟在一张表中插入数据并收集统计信息 SQL> create table ahern.test as select * from dba_objects; 表已创建。 SQL> insert into ahern.test select * from ahern.test; 已创建 72974 行。 SQL> insert into ahern.test se…

Python 短文本匹配,短文本语义相似度,基于大模型的短文本匹配,基于LLMs的短文本语义相似度识别,短文本语义扩充和匹配

1.任务描述 之前在做疾病相似度匹配的时候&#xff0c;堪称史诗级难题&#xff0c;虽然最后加上规则以及一些nlp模型&#xff0c;取得了差强人意的效果&#xff0c;但是短文本的语义相似度匹配一直属于比较难以攻克的难题 2.思路 随着近年大模型的飞速发展&#xff0c;就之前…

链表题目练习----重排链表

这道题会联系到前面写的一篇文章----快慢指针相关经典问题。 重排链表 指针法 这道题乍一看&#xff0c;好像有点难处理&#xff0c;但如果仔细观察就会发现&#xff0c;这道题是查找中间节点反转链表链表的合并问题&#xff0c;具体细节有些不同&#xff0c;这个在反装中间链…

mysql数据备份和还原知识点

MySQL 数据备份和还原是数据库管理的关键操作&#xff0c;确保数据的安全性和可恢复性。 以下是关于MySQL备份和还原的一些关键知识点&#xff1a; 1、数据备份 1.1、mysqldump工具: mysqldump 是MySQL提供的一个命令行实用程序&#xff0c;用于创建数据库或表的结构以及数据…

【Web API DOM11】节点操作

一&#xff1a;DOM节点 1 什么是DOM节点 DOM树里每一个内容都称为节点 2 DOM节点分类 元素节点 属性节点&#xff1a;a标签的href、img标签的src等 文本节点&#xff1a;标签中的文字 上图为整个DOM树&#xff0c;每个标签、以及标签属性、文本内容构成了DOM树 二&#…

现代社区管理中的电瓶车违停检测技术

随着城市化进程的加快&#xff0c;电瓶车作为一种环保、便捷的出行工具在社区内的使用越来越普及。然而&#xff0c;电瓶车的随意停放问题也日益严重&#xff0c;影响了社区的整体环境和居民的生活质量。为了解决这一问题&#xff0c;社区管理者迫切需要一种高效、准确的电瓶车…

54、二分图的最大匹配

二分图的最大匹配 题目描述 给定一个二分图&#xff0c;其中左半部包含n1个点&#xff08;编号1n1&#xff09;&#xff0c;右半部包含n2个点&#xff08;编号1n2&#xff09;&#xff0c;二分图共包含m条边。 数据保证任意一条边的两个端点都不可能在同一部分中。 请你求出…

从list的模拟实现中了解迭代器的设计方式

欢迎来到博主的专栏&#xff1a;c杂谈 博主ID&#xff1a;代码小豪 文章目录 迭代器——容器与算法的桥梁容器与迭代器算法与迭代器迭代器总结 迭代器——容器与算法的桥梁 如果你尝试使用过STL&#xff0c;那么一定对迭代器不感到陌生&#xff0c;迭代器作为STL六大组件之一&…

QT 创建文件 Ui 不允许使用不完整类型,可以尝试添加一下任何头文件

#include "debug.h" #include "qmessagebox.h" #pragma execution_character_set("utf-8") //QT 创建文件 Ui 不允许使用不完整类型,尝试添加一下任何头文件&#xff0c;或者添加ui_xx.h头文件 debug::debug(QWidget *parent) : QDialog(p…

Kotlin getter 和 setter

文章目录 定义field 字段&#xff08;Backing Fields&#xff09; 定义 我们可以为变量定义get&#xff08;无参数&#xff0c;有与变量同类型的放返回值&#xff09;或set&#xff08;有一个与变量类型相同的参数&#xff0c;返回Unit&#xff09;函数&#xff0c;在取值&…

【MATLAB源码-第224期】基于matlab的快跳频系统仿真采用4FSK,模拟了单音干扰,宽带干扰以及部分频带干扰,输出误码率曲线以及各节点图像。

操作环境&#xff1a; MATLAB 2022a 1、算法描述 跳频通信系统概述 跳频通信系统是一种通过快速切换载波频率来进行信息传输的无线通信技术。它在军事和商业通信中广泛应用&#xff0c;具有较强的抗干扰和抗截获能力。系统设计主要包括信号调制、跳频序列生成、信道模拟以及…

dart 基本语法

//入口方法 main() 或 void main() //数据类型 原生数据类型 String int double bool null 注意&#xff1a;String 包函 ‘’ “” ‘’’ ‘’’ 三种形式复杂数据类型 list Set Map自定义数据类型 class inheritance动态数据类型 var 注&#xff1a;dart 是静态类型语言&a…