超级逼真人脸生成,Stable Diffusion的3个关键技巧

大家好,你是否曾想过,为什么别人可以使用AI图像生成技术生成如此逼真的人脸,而自己的尝试却充满了错误和瑕疵,让人一眼看出是假的。尝试过调整提示和设置,但似乎仍无法与他人的质量相匹配。

本文将带大家了解使用Stable Diffusion生成超逼真人脸的3个关键技巧。首先将介绍提示工程的基础知识,帮助使用基础模型生成图像。接下来,将探讨升级到Stable Diffusion XL模型后,如何通过更多的参数和训练来显著提高图像质量。最后,为大家介绍一种专门用于生成高质量人物肖像而微调的自定义模型。

1. 提示工程

首先,我们将学习如何编写正面和负面的提示来生成逼真的人脸。我们将使用Hugging Face Spaces上提供的Stable Diffusion版本2.1演示。它是免费的,并且可以在不做任何设置的情况下开始使用。

【链接】:hf.co/spaces/stabilityai/stable-diffusion

在创建正面提示时,确保包含图像的所有必要细节和风格。在本例中,我们希望生成一张年轻女子在街上行走的图像。我们将使用一个通用的负面提示,但是可以添加其他关键词以避免图像中的重复错误。

正面提示:“A young woman in her mid-20s, Walking on the streets, Looking directly at the camera, Confident and friendly expression, Casually dressed in modern, stylish attire, Urban street scene background, Bright, sunny day lighting, Vibrant colors”。

负面提示:“disfigured, ugly, bad, immature, cartoon, anime, 3d, painting, b&w, cartoon, painting, illustration, worst quality, low quality”。

图片

图片

我们有了一个良好的开端。图像是准确的,但图像质量可以更好。可以尝试调整提示,但这已经是基础模型能够提供的最好效果了。

2. Stable Diffusion XL

我们将使用Stable Diffusion XL(SDXL)模型生成高质量图像。它通过使用基础模型生成潜在图像,然后使用一个细化器对其进行处理,从而生成详细而精确的图像。

【链接】:hf.co/spaces/hysts/SD-XL

在生成图像之前,我们将向下滚动并打开“Advanced options(高级选项)”。我们将添加一个负面提示,设置种子,并应用细化器以获得最佳的图像质量。

图片

然后,我们将以与之前略有不同的方式编写相同的提示。我们将生成一个年轻的印度女子的图像,而不是普通的年轻女性。

图片

这个结果有了很大的改进。面部特征非常完美。让我们尝试生成其他民族的图像,检查是否存在偏差,并比较结果。

图片

我们得到了逼真的人脸,但所有图片都使用了Instagram滤镜。通常,现实生活中的皮肤并不光滑,而是有粉刺、印记、雀斑和细纹等。

3. CivitAI: RealVisXL V2.0

在这部分,我们将生成带有痕迹和真实肌肤的详细人脸。为此,我们将使用CivitAI的自定义模型(RealVisXL V2.0),该模型经过优化,用于生成高质量肖像。

【链接】:civitai.com/models/139562/realvisxl-v20

可以通过点击“Create(创建)”按钮在线使用该模型;也可以下载它,以在Stable Diffusion WebUI上本地使用。

图片

首先,下载模型并将文件移动到Stable Diffusion WebUI模型目录:C:\WebUI\webui\models\Stable-diffusion。

要在WebUI上显示模型,需要按下刷新按钮,然后选择“realvisxl20…”模型检查点。

图片

我们将从编写相同的正面和负面提示开始,并生成一张高质量的1024X1024图像。

图片

图像看起来非常完美,为了充分利用自定义模型,我们需要更改提示。

图片

新的正面和负面提示可以通过滚动模型页面并点击喜欢的真实图像来获得。CivitAI上的图像具有正面和负面提示以及高级转向功能。

正面提示:“An image of an Indian young woman, focused, decisive, surreal, dynamic pose, ultra highres, sharpness texture, High detail RAW Photo, detailed face, shallow depth of field, sharp eyes, (realistic skin texture:1.2), light skin, dslr, film grain”。

负面提示:“(worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch), open mouth”。

图片

我们有了一张具有真实肌肤的印度妇女的详细图像。与基础SDXL模型相比,这是一个改进版本。

图片

我们又生成了三张不同民族的图像,以比较结果。结果非常出色,包含皮肤痕迹、多孔皮肤和准确的特征。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/239158.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode-17 电话号码的字母组合

LeetCode-17 电话号码的字母组合 给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。答案可以按 任意顺序 返回。 给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。 示例 1: 输入:d…

硬件产品经理:硬件产品敏捷开发

目录 简介 敏捷 CSDN学院 作者简介 简介 之所以敏捷产品开发流程会越来越普遍。 主要得益于这个方法可以让企业使用更少的资源去开发出令客户满意的新产品。 敏捷开发强调的最重要的一点就是“快”。 也就是要求通过快速迭代来获取频繁的客户反馈。 这就特别适合应对市…

Python教你如何让代码摆脱死循环的困扰!

更多资料获取 📚 个人网站:ipengtao.com 在编写Python代码时,无限循环是一个常见的问题,可能导致程序陷入死循环,使得代码无法正常执行。这篇博客将介绍一些方法,帮助大家防止和处理无限循环,确…

ansible变量的使用

本章主要介绍playbook中的变量 自定义变量使用变量文件字典变量列表变量facts变量内置变量变量的过滤器 为了能够写出更实用的playbook,需要在playbook中使用变量。下面来讲解playbook 中常见的变量。本章实验都在/home/lduan/demo2下操作,先把 demo2目…

百度网盘资源下载慢解决方法

1、使用百度网盘客户端,设置使用空闲带宽下载 亲测,可以一定程度上解决下载慢的问题,但是对于有些文件下载还是很慢就不清楚为什么了。 2、使用IDM进行下载 (1)、第一步下载和安装IDM 搜索后,普通下载后安…

BWS2000倾角传感器c++测试代码【1】

使用瑞芬的倾角传感器配置的时候,数据手册一下就配置好了,但是BWS2000倾角传感器总是出错,这里进行一下记录出现的问题与解决方式。 1.初步测试 在配置BWS2000倾角传感器读取帧数据的时候,总是出现一个问题,就是进行…

Qt/QML编程学习之心得:在QML工程中添加库(十四)

实现库并且使用库,类似于vc中的静态库library、动态库dll、COM组件等方法一样,在Qt中也经常会使用库,或者将部分功能打包成库。 右击Qt项目,点击add library... 在linux中将.a文件导入,工程会自动在.pro温江中增加相应…

关于频谱仪是如何来实现辐射功率测量

1.1 内部基本原理框架 首先是接收到外部信号输入,然后经过可变衰减器衰减,接着进行变频,接着经过带宽带通滤波器进行滤波,滤波后的信号送入检波器进行信号检测,再经对数放大器放大后,送入低通滤波器进行视频…

Java文件流大家族(通俗易懂,学习推荐版,很详细)——操作文件本身和文件中的数据

1.File(操作文件本身) 1.定义 目录 2.常用方法 3.路径引用符 可以用/或者\\分隔路径 还可以用File.separator分隔路径,会根据不同系统使用啥分隔符。 4.绝对路径、相对路径及桌面路径表示 桌面路径为: 我电脑的用户名为X 5.示例…

解决找不到vcruntime140.dll无法继续执行的多种方法分享

最近,我在使用电脑时遇到了一个问题,即“由于找不到vcruntime140.dll无法继续执行”。vcruntime140.dll是Visual C Redistributable Packages中的一个组件,它是Visual Studio 2015中运行C程序所必需的。如果找不到vcruntime140.dll文件&#…

C++实现增序含头结点的单链例题:现已知单链表L中结点是按整数值递增排列,试写一算法将值为X的结点插入到表L中,使得L任然递增有序

因为比较简单直接给代码&#xff1a; <1>.c文件 #include"Module.h" int main() {int m 0;int flag 0,elect0;printf("*-----------------------------------------------------------------------------------------*\n");struct STU* List Cr…

Python接口自动化测试实战(视频教程+源码)

接口自动化测试是指通过编写程序来模拟用户的行为&#xff0c;对接口进行自动化测试。Python是一种流行的编程语言&#xff0c;它在接口自动化测试中得到了广泛应用。下面详细介绍Python接口自动化测试实战。 1、接口自动化测试框架 在Python接口自动化测试中&#xff0c;我们…

论文阅读——llava

Visual Instruction Tuning LLaVA 指令智能体分为两类&#xff1a;端到端的&#xff0c;通过LangChain[1]/LLM[35]协调各种模型的系统。 数据集生成用GPT辅助生成的&#xff0c;具体不写了。 模型结构&#xff1a; input image Xv LLM&#xff1a;Vicuna visual encoder&a…

MySQL的hash索引

MySQL有BTree 索引及Hash索引等索引类型&#xff0c;BTree索引类型是MySQL采用最多的索引类型。Hash索引使用场景比较有限&#xff0c;文章将从Hash索引的底层结构出发&#xff0c;来分析Hash索引的利与弊。 1 hash数据结构 hash数据结构由键、哈希函数及哈希表组成。 键&am…

Redis BitMap(位图)

这里是小咸鱼的技术窝&#xff08;CSDN板块&#xff09;&#xff0c;我又开卷了 之前经手的项目运行了10多年&#xff0c;基于重构&#xff0c;里面有要实现一些诸如签到的需求&#xff0c;以及日历图的展示&#xff0c;可以用将签到信息存到传统的关系型数据库&#xff08;MyS…

如何无损放大图片?教你三种方法轻松提高画质

如何无损放大图片&#xff1f;如果你在网上找到的素材图片分辨率低且模糊不清&#xff0c;又找不到原图的出处&#xff0c;那么如何无损放大图片呢&#xff1f;以下三个技巧可以帮你解决这个问题。 技巧一&#xff1a;使用专业的图像处理工具 水印云一款专业的图像处理工具可以…

Flutter本地化(国际化)之App名称

文章目录 Android国际化IOS国际化 Flutter开发的App&#xff0c;如果名称想要跟随着系统的语言自动改变&#xff0c;则必须同时配置Android和IOS原生。 Android国际化 打开android\app\src\main\res\values 创建strings.xml 在values上右键&#xff0c;选择New>Values Res…

6. 行为模式 - 观察者模式

亦称&#xff1a; 事件订阅者、监听者、Event-Subscriber、Listener、Observer 意图 观察者模式是一种行为设计模式&#xff0c; 允许你定义一种订阅机制&#xff0c; 可在对象事件发生时通知多个 “观察” 该对象的其他对象。 问题 假如你有两种类型的对象&#xff1a; ​ 顾…

MyBatis关联查询(三、多对多查询)

MyBatis关联查询&#xff08;三、多对多查询&#xff09; 需求&#xff1a;查询角色及角色赋予的用户信息。 分析&#xff1a;一个用户可以拥有多个角色&#xff0c;一个角色也可以赋予多个用户&#xff0c;用户和角色为双向的一对多关系&#xff0c;多对多关系其实我们看成是…