Stable Diffusion 扩展知识实操整合

本文的例子都是基于秋叶整合包打开的webui实现的

一、ADetailer——改善人脸扭曲、恶心

After detailer插件可以自动检测生成图片的人脸，针对人脸自动上蒙版，自动进行重绘，整个流程一气呵成，因此可以避免许多重复的操作。除此之外，Adetailer还可以检测整个人物的手部、眼睛甚至全身，并针对这些部分进行重绘

实例：8个女孩，脸已经崩了

使用After detailer后：脸有了明显的改善

建议使用Euler a采样方法，生成的图像质量好一些

yolov8的修复效果不太好，建议使用mediapipe_face_full，但是mediapipe经常检测不到侧脸

After detailer也可以使用独立参数，但一定要记得打钩，不打钩的话，参数设置也没用

写实的模型还没用过

各模型使用范围：

二、Tiled Diffusion、Tiled VAE 放大图片

通过Tiled Diffusion技术，可以将图像划分为多个小块（tiles），然后对每个小块进行处理，从而生成高分辨率的图像，适用于显存不够的情况
Tiled VAE是将 VAE 移动到 GPU (如果允许)
例如生成一个512*512图像（兔儿旗袍女性）

使用Tiled Diffusion和Tiled VAE后生成了一副1024*1024的图像，图像大体不变、只是一些细节变化了

参数如下，只需改一下放大算法和放大倍数就可以

R-ESRGAN 4x+：写实图片
R-ESRGAN 4x+ Anime6B：二次元图片
如果在网上下载了新的放大模型，放在 sd-webui-aki-v4.10\models\ESRGAN 路径下

三、Dynamic Thresholding (CFG Scale Fix)动态CFG值调整

CFG（Control Flow Guidance）值是Stable Diffusion中控制生成图像与提示词（Prompt）关联强度的核心参数。动态CFG值调整指在图像生成过程中实时调整CFG值，以解决高CFG值导致的色彩失真、细节过度锐化等问题，同时平衡生成质量与多样性。

应用场景:
1、高分辨率生成：在SD3中，动态CFG配合Shift参数调整，优化百万像素级图像的噪声管理。
2、风格化生成：使用动漫、写实等风格LoRA时，动态CFG可抑制风格冲突导致的细节失真
3、低显存适配：通过分阶段CFG调整，降低高分辨率生成时的显存峰值占用。

举例：science fiction,realistic,Cinematic Lighting,chocolate,city_lights,
左边没用动态CFG值调整，右边使用了动态CFG值调整，右边的效果更好
左边文生图，右边是左侧的图生图