Stable Diffusion WebUI 附加功能/图片放大(Extras):单张图片/批量处理/从目录进行批量处理

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。

大家好,我是水滴~~

篇文章主要讲解 Stable Diffusion WebUI 的附加功能/图片放大(Extras)的使用,主要包括:单张图片、批量处理、从目录进行批量处理。文章中包含大量的图片和示例,非常适合新手同学,希望对你有所帮助!

文章目录

  • 一、单张图像
    • 1. 来源(Source)
    • 2. 缩放比例(Scale by)
    • 3. 指定分辨率缩放(Scale to)
    • 4. 放大算法1(Upscale 1)
    • 5. 放大算法2(Upscale 2)
    • 6. 面部修复(GFPGAN 和 CodeFormer)
  • 二、批量处理
  • 三、从目录进行批量处理


Stable Diffusion WebUI 的附加功能(Extras)是一个强大的工具,它主要用于优化、清晰化和扩展图像。通过调节Extras中的相关参数,用户可以将小图、模糊的图或有噪点的图放大、清晰化处理为更大的图。这一过程中,不仅原图中的图像信息得以保留,而且由于分辨率的提高,图像内容也会得到进一步的细化和增加。

Extras在 Stable Diffusion WebUI 中的位置通常放在第三个标签,这也代表它往往是 AI 生成图像的第三大步骤。在实际应用中,用户通常首先使用tex2img功能大批量地生成小图(512像素),然后从中筛选出接近满意的结果,接着通过img2img功能进行调整,最后再利用Extras功能生成最终的大图。这一流程已被众多从业者证明为最高效的方法。

image.png
Extras提供三个选项卡:单张图像、批量处理、从目录进行批量处理。我们依次来看下它们的功能,并使用实例来演示:

一、单张图像

单张图像(Single Image)这一选项允许用户一次只处理一张图片。用户可以选择一张需要优化的图片,然后通过Extras中的相关参数进行超分辨率处理、清晰化或其他图像处理操作。当用户只需要处理单张图片,或者想要对每张图片进行个别调整时,可以选择这个功能。

1. 来源(Source)

来源(Source)用于上传待处理的图片。可以点击上传图片;或者将图片拖放至此;还可以从其它地方发送到“附加功能”,例如:文生图、图生图、图库浏览器等界面。
image.png
今天又生成了一批小姐姐,从中选择一个最漂亮的,上传至此:
image.png
本图像分辨率:512 x 768
00079-2506701637.png

2. 缩放比例(Scale by)

缩放比例(Scale by)表示图像放大的倍数,最低1倍,最高8倍,默认4倍:
image.png
例如,下图放大了4倍(2048 x 3072):
00031.png

3. 指定分辨率缩放(Scale to)

指定分辨率缩放(Scale to)表示自定义分辨率。如果自定义的比例与原图不相同,一定要勾选“裁剪”,否则图像将被拉伸变形。
image.png
例如,下图为 512 x 512
00032.png

4. 放大算法1(Upscale 1)

放大算法(Upscaler)是一种用于增强图像分辨率或尺寸的技术。在 Stable Diffusion 中,放大算法旨在将低分辨率的图像无损或尽可能少地损失细节地放大到更高的分辨率。这通常涉及到复杂的数学和机器学习技术,以确保放大后的图像在视觉效果上尽可能接近原始高清图像。
image.png
这些放大算法各有优缺点,我们不过多介绍,对于新手而言,这里只使用两个即可:

  • R-ESRGAN 4x+ Anime6B:绘制二次元漫画风格时使用。
  • R-ESRGAN 4x+:绘制其它风格时使用。
    R-ESRGAN 4x+ 算法放大效果:
    在这里插入图片描述

5. 放大算法2(Upscale 2)

这里还有个放大算法2(Upscale 2),这是因为可以结合两个放大算法来放大图片。后面的“放大算法2可见度”就表示两者使用的占比。可见度为0时,表示使用放大算法1;可见度为0.3时,表示70%使用放大算法1,30%使用放大算法2;可见度为1时,表示使用放大算法2。
image.png

6. 面部修复(GFPGAN 和 CodeFormer)

在附加功能里,还提供了两个面部修复功能 GFPGANCodeFormer。经过我的测试,这两个无法修复畸形脸,只能修复模糊的脸:
image.png
使用一张模糊的照片,下面对比一下他们的修复效果:

  • GFPGAN

image.png

  • CodeFormer

image.png

二、批量处理

批量处理(Batch Process)功能允许用户一次性上传多张图片进行处理。用户可以选择一个包含多张图片的文件夹,然后应用相同的处理参数对所有图片进行批量操作。当用户需要处理大量图片,并且希望所有图片都应用相同的处理效果时,这个功能会非常有用。它大大提高了处理效率,减少了重复操作的时间。

点击上传:
image.png
这里可以选择多个照片:
image.png
点击“生成”按钮后,会逐个放大选中的照片:
image.png

三、从目录进行批量处理

从目录进行批量处理(Batch from Directory)功能允许用户不打开图片,而是直接选择包含图片的目录所在位置,然后处理该目录下的所有图片。用户还可以在设置中选择是否保留原来的文件名,以便在处理后能够方便地识别和管理图片。当用户需要处理整个目录下的图片,并且不希望手动选择每一张图片时,可以使用这个功能。它特别适用于那些有大量图片需要处理的场景,如批量优化图片库或处理项目中的所有图片。

这里需要填写两个目录(路径中不要有中文):输入目录为原图片目录;输出目录为放大后的图片目录,需要提前创建好。
image.png
输入目录,用来存放原图:
image.png
输出目录,用来存放放大后的照片,文件名与原图文件名保持一致:
image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/786561.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[ruby on rails] ruby使用vscode做开发

ruby LSP实现 ruby插件推荐用这个来实现,但是现在这个在加载文件索引时候,特别慢,时好时坏,所以现在推荐用Solargraph实现 ruby LSP要求ruby版本3以上,如果在旧版本中使用,需要指定bundleGemfile路径 旧版…

1-31 正则表达式 String Buffer String Builder

一.作用:判断指定的String类型值 是否符合指定的规则存储的公式,正确规则表达式 二.为了避免发开中存在差异,Java提出了一些指定的字符,进行正则的编写 符号含义^行起始符 (实际开发中不常用)$行结束符(实际开发中不常用)[]表示某一个位置 , 当且仅当该位置上只有一种可能 []…

量化交易入门(三十八)CCI指标Python实现和回测

今天我们先单纯用CCI指标来完成策略的编写,后续我们会改进这个策略,将CCI指标和前面讲到的MACD和RSI相结合来优化,看看我们优化后的效果会不会更好。 一、量化策略 CCI指标在量化交易中的策略: 在以下情况下生成买入信号&#…

预处理指令——一些比较少见的概念

前言:预处理是我们的c语言源代码成为可执行程序的第一个步骤。而宏和预处理指令都是在这个阶段完成。本节内容就是关于宏和预处理指令相关知识点的解析。 目录 宏 预定义符号 #define定义常量 #define定义符号 #define定义宏 带副作用的宏参数 宏的替换规则…

基于SSM的“超市管理系统”的设计与实现(源码+数据库+文档+PPT)

基于SSM的“超市管理系统”的设计与实现(源码数据库文档PPT) 开发语言:Java 数据库:MySQL 技术:SSM 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 系统功能设计图 首页 后台管理登录页面 采购查询管理 采购员登录…

linux正则表达式之[]

1.[]含义 linux正则表达式[]表示字符集合的重复特殊字符的符号。 2.样例 正则表达式[]样例 命令1: grep -n "p[wldn]" anaconda-ks.cfg #需要特别注意的是,在[ ]中“仅代表一个待搜索的字符”。命令1的意思是搜索含有(pw)或(pl)或(pd)或…

配置 施耐德 modbusTCP 分布式IO子站 RPA0100

1. 总体步骤 2. 软件组态:在 Unity Pro 软件中创建编辑 PRA 模块工程 2.1 新建项目 模块箱硬件型号如下 点击 Unity Pro 软件左上方【新建】按钮,选择正确的 DIO 模块型号、背板型号 2.2 模块组态 2.2.1 拖拽添加模块 双击【配置】菜单下的【0&…

数据库设计-MySQL设计小册

前言 最近回顾了下MySQL相关的知识,比如索引、几大日志、事务、MVCC、SQL执行流程、Buffer Pool等等。理论知识看了一大堆,自然还是需要实践的,第一个反应就是数据库设计规范。项目开发中,数据库设计自然是重要的一环&#xff0c…

dotcpp题目 1020: [编程入门]猴子吃桃的问题

一、题目 题目描述 猴子吃桃问题。猴子第一天摘下若干个桃子,当即吃了一半,还不过瘾,又多吃了一个。 第二天早上又将剩下的桃子吃掉一半,又多吃一个。以后每天早上都吃了前一天剩下的一半零一个。 到第N天早上想再吃时&#xff0c…

关于loop( ) 阻塞和非阻塞探究

一、SIR的补充 在上几篇博客中,有朋友私信问我,在ticker函数程序和中断服务程序(ISR)中写 物联网请求报错。怎么回事,在此解释。控制台如下 1.1解释 在使用 Ticker 函数和中断服务程序(ISR)时…

ARM IHI0069F GIC architecture specification (6)

2.3 亲和路由 亲和路由是一种基于分层地址的方案,用于识别中断路由的特定PE节点。 对于 PE,AArch64 状态的亲和性值在 MPIDR_EL1 中定义,AArch32 状态的亲和性值在 MPIDR 中定义: • 关联路由是一个由四个8 位关联字段组成的32 位…

问题解决:gorm查询oracle库表,返回struct字段数据为空的问题

package model// 表对应的struct // github.com/cengsin/oracle v1.0.0 // gorm.io/gorm v1.21.16 // 注意:column:USERNAME字段必须大写(oracle表中字段名大写),否则查询出的struct字段值会为空 type BBUser struct {Username …

开源简单方便功能强大的Devops工具:Goploy

Goploy:加速您的DevOps旅程,拥抱无缝部署——选择Goploy,让您从繁琐的发布与回滚中解放出来,尽享高效、智能与便捷的自动化部署力量! - 精选真开源,释放新价值。 概览 现在大部分流行的发布工具功能虽然强…

Leetcode-2810-故障键盘-c++

题目详见https://leetcode.cn/problems/faulty-keyboard/ 题解 这道题的关键是如何合理地使用STL,毕竟是一道简单题。 之前常用到的Vector容器是单向开口的连续内存空间 deque则是一种双向开口的连续线性空间,又称双端动态数组。所谓的双向开口&#x…

Mongodb字段更新操作符$currentDate

学习mongodb,体会mongodb的每一个使用细节,欢迎阅读威赞的文章。这是威赞发布的第54篇mongodb技术文章,欢迎浏览本专栏威赞发布的其他文章。 本文基于Mongodb的官方文档,整理了Mongodb字段更新操作符$currentDate的定义&#xff…

[数据结构]动态顺序表制作源码分享

顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构,一般情况下采用数组存 储。在数组上完成数据的增删查改。 顺序表一般可以分为: 1. 静态顺序表:使用定长数组存储元素 2. 动态顺序表:使用动态开辟的数组存储。…

bugku-web-速度要快

发现phpsessid 从上述提示 提示发送post请求,并且带有参数margin 发送后发现报文头部有一个字段叫flag,但好像每一次flag都不一样 构建Python脚本 request requests.Session()data {margin:find, } for i in range(50):html request.post(urlhttp:/…

2024年04月在线IDE流行度最新排名

点击查看最新在线IDE流行度最新排名(每月更新) 2024年04月在线IDE流行度最新排名 TOP 在线IDE排名是通过分析在线ide名称在谷歌上被搜索的频率而创建的 在线IDE被搜索的次数越多,人们就会认为它越受欢迎。原始数据来自谷歌Trends 如果您相…

websocket多级nginx代理

在使用多层Nginx代理时,WebSocket的连接可能会遇到一些问题,因为WebSocket连接是持久化的,它需要Upgrade头部来确认升级到WebSocket协议。在多层代理的情况下,每层代理可能会修改或丢失这个Upgrade头部信息。 为了确保WebSocket能…

深度学习训练过程中,常见的关键参数和概念讲解

深度学习训练过程中的关键参数和概念对于构建、理解和优化模型至关重要。以下是一些最常见的参数和概念,以及它们的简要解释: 1. 学习率(Learning Rate) 学习率是优化算法中最重要的参数之一,它控制着权重调整的幅度…