AI 创业指难(一) :Stable Diffusion AI 绘画怎么用

一. 前言

一年不到,AI对生活和工作的影响已经逐步体现。所以千万别掉队了,也许 AI 不能成为我们的主要工作,但是如何借助 AI 实现副业的扩展同样值得思考。

这一篇就来讲一个 AI 绘画工具,这个工具我也是才上手不久,所以我把这其中的一些笔记分享出来,希望大家都能融入到这个新的时代。

Stable Diffusion

stable diffusion 本质上是一个 AI 绘图生成工具,我想大家肯定听说过它的竞品 : Midjourney

之所以选择 Stable Diffusion 的主要原因就是它免费,本地就可以搭建,开源资源丰富 , 适合我们这些业务人员去折腾。

实测 4060 笔记本显卡一张图 1024 大小的图大概在 10S 左右 , 如果嫌慢不要紧, 阿里云买一个抢占式的 GPU 服务器再部署一套到云环境上面,一小时也只要3块钱。

  • 欠拟合 :指模型不能在训练集上取得好的结果。学了又好像没有完全学会
  • 过拟合 :指在训练集上表现很好,但是测试集上表现很差
  • 不收敛 : 训练失败,根本没学会
  • 泛化能力 :指的AI对未知样本的推理、适应能力

二. 安装和使用

基础安装太简单了,果然玩图的大佬都是热心肠,这里推荐直接使用 sd-webui-aki Bilibili 地址。

image.png

启动的效果就是这样,入门使用只需要关注2个点 :

  • 模型管理 : 在各模型网站下载对应模型后添加进去即可
  • 一键启动 : 直接启动运行

几个好用的模型网站 :

  • 土司 : tusiart.com/
  • civitai : civitai.com/
  • liblib : www.liblib.ai/

三. 使用方式

image.png

整个主界面大致如下 ,来简单说一下其中这些关键的信息 :

👉 001 : 基础模型是什么?

模型就是我们在上述模型网站中找到的喜欢的模型,模型很多,我们只需要找到自己想要生成的去下载即可

image.png

下载完模型后,将模型添加到工具的模型管理中,然后在主界面模型旁边点击刷新就能应用上去。

模型也有对应的类型,这里简单概述下 :

  • LoRA :通常用于人物和概念,体积小且控图效果好,常用于固定角色特征
  • Checkpoint : 体积较大,用于控制画风
  • Embedding : 适用于控制画风和人物,相对速度中等
  • Dreambooth : 可以用于人物,概念和画风,对配置要求较高

对我这种新手来说基本上不关注这个,模型训练可能是后续的实践中才需要使用到。

👉 002 : VAE 模型是什么 ?

Variational autoenconder,中文叫变分子编码器 ,主要的作用就是滤镜。在出图的时候会影响颜色和线条

一般大模型里面都会自带 VAE , 出图如果有问题才可能需要用到它

image.png

尝试了一下,左边的为原厂模型,右边加了其他 VAE. 虽然不明显,但是在颜色上还是有一些色差。

👉 003 / 004 : 提示词怎么写 ?

提示词分为正向提示词和反向提示词 ,

  • 正向提示词
    • 通过提示词 来指定生成的图像
    • 提示词的顺序会影响到图像的生成 ,前面的提示词权重更大
  • 排除词
    • 用于指定图像中不期望出现的东西 (低质量,小图,五官不全)
  • 权总
    • stable diffusion 支持对提示词进行权重设置,点击提示词按 Ctrl + 上下方向键

那么提示词该怎么去找,去哪里找呢?

方案一 : 通过 Stable Diffusion 的工具反推提示词

image.png

直接把图片拖进去,就能得到对应的提示词,后续直接使用即可。

方案二 : 去模型网站或者图站查找提示词

image.png

一般下载的模型下面都能找到一些效果图,点进去就能看到对应的提示词

方案三 : 找 GPT 问或直接写

image.png

👉 005 :步数的作用是什么 ?

  • 迭代每一步都是在前一步的基础上进行处理
  • 低的采样步数会导致画面计算不完整,高的采样步数仅在细节处进行优化,对比输出速度得不偿失

👉 006 :采样方式有什么用 ?

采样方式指的是模型生成图像时所采用的策略,决定了如何从模型的输出分布中选择样本。

不是很了解,帮不了太多,但是文档我给你们找好了呀!!!

上文界面里面的采样方式主要有以下区别 :(PS 这一块网上资料也不多,只能做到这个地步了

算法速度步数优 / 缺点场景
Euler a20-301. 适当的步长出图更快 2. 步长过大会过度拟合,图像变形
3. 富有创造力ICON , 二次元,小场景
Euler20-30- 基于Karras论文
LMS30+1. 效果一般,比较抽象 , 质感OA,饱和度与对比度偏低,更倾向于动画的风格
2. 线性多步调度器(Linear multistep scheduler)
Heun20-30- 基于Karras论文
DPM220-30该采样方法对tag的利用率最高,几乎占80%+
DPM2 a25-30几乎与DPM2相同,对人物可能会有特写
DPM++ 2S a20-30
DPM++ 2M20-30
DPM++SDE
DPM++2S a Karras- 在每个时间步长中执行多次操作
- 同等分辨率下细节更多
- 步长越多细节越明显
写实人物,复杂场景
DPM++ 2M Karras20-301. 是二阶扩展概率模型求解的算法 2. 可以在速度和质量之间平衡
DPM ++ SDE Karras8-12
DDIM10-151. 步数越多细节越丰富 2. 收敛快,可以快速生成高质量图像
写实人像,复杂场景刻画
UniPc20-30
DPM adaptive10
LMS Karras20会大改成油画的风格,写实不佳
DPM2 Karras20-30
DPM2 a Karras20-30

👉 007 :关于图像大小 ?

  • 图像越大,从而需要往图片中加入更多的元素,越容易出现低质量的信息
  • 如果图像大小一样,相同的提示词可能会出现类似的结果,但是大小一旦变化,图像的变化就极大
  • 图像越大,花的时间必然就会越长
  • 总结 : 图像不是越大越好,过大的图像反而影响整体质量。

关于宽度 :

  • 推荐 512 x 512 ,一般模型都是在这个基础上进行计算的
  • 宽带必须是 8 的倍数
  • 宽度不适合太大,容易出现图像崩溃
  • 高度同理

👉 008 :CFG Scale (提示词引导系数 )

  • 控制图像与提示词之间的契合度,这个值越高,生成的图像也越接近你的提示词
  • 这个值一定程度上会降低图像质量,因为相当于限制了范围
  • 建议 7- 15

其他功能补充 :

随机种子的作用

  • 随机种子可以帮助我们锁定图像范围 ,使用相同种子的时候可以生成类似的图像
  • 相同的随机种子可以提高图像的可重复度和相似性,用于调优和优化模型
  • 当使用 -1 随机种子时图像完全随机,完全无规律

image.png

总结

首篇完成,算是对这段时间学习的一个总结,期望能对大家有所帮助。

学无止境, 这个系列也是一直会保持更新。

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/802018.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

冻干可以长期给猫咪吃吗?五款顶尖生骨肉冻干盘点推荐

近年来,冻干猫粮因其高品质而备受喜爱,吸引了无数猫主人的目光,像我这样的养猫老手早已开始冻干喂养。但对于新手养猫的人来说,他们可能会对冻干猫粮感到陌生,并产生疑问:这到底是什么?冻干可以…

.NET 设计模式—装饰器模式(Decorator Pattern)

简介 装饰者模式(Decorator Pattern)是一种结构型设计模式,它允许你在不改变对象接口的前提下,动态地将新行为附加到对象上。这种模式是通过创建一个包装(或装饰)对象,将要被装饰的对象包裹起来…

看看你的身体出现了哪些症状,要当心了!

身体出现以下五个症状,你要小心了。 夜间尿频,不要以为晚上喝水喝多了,很有可能是你的血糖升高了,血糖过高的人,口腔很容易受到刺激,而感到非常的干燥,所以会通过补充水分的方式来缓解&#xff…

算法练习第四十六天|多重背包、139. 单词拆分

题目描述 你是一名宇航员,即将前往一个遥远的行星。在这个行星上,有许多不同类型的矿石资源,每种矿石都有不同的重要性和价值。你需要选择哪些矿石带回地球,但你的宇航舱有一定的容量限制。 给定一个宇航舱,最大容量为…

基于java+springboot+vue实现的农产品销售系统(文末源码+Lw)23-231

摘 要 如今社会上各行各业,都喜欢用自己行业的专属软件工作,互联网发展到这个时候,人们已经发现离不开了互联网。新技术的产生,往往能解决一些老技术的弊端问题。因为传统乐乐农产品销售系统信息管理难度大,容错率低…

Springboot-redis整合

Springboot-redis命令行封装 前言 Redis(Remote Dictionary Server),即远程字典服务,是一个开源的使用ANSI C语言编写的、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。Redis也是现…

CSS导读 (Emmet语法)

(大家好,今天我们将继续来学习CSS的相关知识,大家可以在评论区进行互动答疑哦~加油!💕) 目录 续:七、Chrome调试工具 一、Emmet语法 1.1 快速生成HTML结构语法 1.2 快速生成CSS样式语法 &…

LangChain-10 Agents langchainhub 共享的提示词Prompt

LangChainHub 的思路真的很好,通过Hub的方式将Prompt 共享起来,大家可以通过很方便的手段,短短的几行代码就可以使用共享的Prompt。 我个人非常看好这个项目。 官方推荐使用LangChainHub,但是它在GitHub已经一年没有更新了&#x…

如何实现在线程池中执行远程调用可以获取到主线程的请求上下文

public class ThreadPoolConfig {/*** 异步任务执行线程池** return*/Bean("taskExecutor")public TaskExecutor taskExecutor() {ThreadPoolTaskExecutor executor new CustomThreadPoolExecutor();// 设置核心线程数executor.setCorePoolSize(5);// 设置最大线程数…

PyCharm安装教程:详细步骤解析

目录 1. 下载 PyCharm 安装包 2. 运行安装程序 3. 选择安装类型 4. 确认安装选项 5. 安装过程中 6. 安装完成 7. 启动 PyCharm 8. 选择版本 9. 登录或注册 10. 激活许可证 11. 激活成功 PyCharm 是一款功能强大的 Python IDE(集成开发环境)&a…

flutter多入口点entrypoint

native中引擎对象本身消耗内存(每个引擎对象约莫消耗42MB内存) 多引擎:native多引擎>启动>flutter多入口点entrypoint>多main函数>多子包元素集>多(子)程序 单引擎(复用):native单引擎>复用启动>flutter多入口点entrypoint>多m…

高等数学基础篇之关于圆,椭圆,圆环的应用

文章目录 前言 1.圆 1.1标准方程 1.2偏心圆 1.3参数方程 2.椭圆 2.1标准方程 2.2参数方程 2.3极坐标 3.圆环 4.扇形 前言 这篇文章主要是应对二重积分出现的一些关于圆的积分域,让大家大概了解一下,不是很详细,因为二重积分对几何…

uniapp请求后端接口

新建文件夹utils const request (config) > {// 拼接完整的接口路径config.url http://mm.test.cn config.url;//这里拼接的是访问后端接口的地址,http://mm.test.cn/prod-api/testconsole.log(config.url)//判断是都携带参数if(!config.data){config.data …

7-26 单词长度

题解&#xff1a; #include <bits/stdc.h> using namespace std; int main() {string s;getline(cin,s); //读取一行字符串char c; //记录字符int cnt 0; //用来记录长度int flag 0; //用来判断是否已经输出了第一个单词的长度for (int i 0;i<s.size(); i)…

【openGL4.x手册14】OpenGL 渲染管道的逻辑运算

目录 一、说明二、逻辑运算三、行动四、写入掩码6.1 颜色掩码6.2 深度mask6.3 模板mask 一、说明 对于渲染管道的混合方案&#xff0c;需要以种种不同混合方案&#xff0c;其中混合的方式用逻辑运算实现。其次&#xff0c;在混合颜色的时候&#xff0c;还有掩码过滤器&#xf…

阿里云新手用户建站必看攻略,从注册域名到网站上线需完成步骤

无论是个人还是企业新手用户&#xff0c;搭建个人或者企业网站都必须进过注册域名、购买云服务器、搭建网站、ICP备案、解析域名等步骤&#xff0c;本文为大家展示阿里云新手用户建站过程中从注册域名到网站上线需要完成的具体步骤。 1、选购域名 域名是互联网世界的门牌号码&…

什么是HW,企业如何进行HW保障?

文章目录 一、什么是HW二、HW行动具体采取了哪些攻防演练措施三、攻击方一般的攻击流程和方法四、企业HW保障方案1.建意识2.摸家底3.固城池4.配神器5.增值守 一、什么是HW 网络安全形势近年出现新变化&#xff0c;网络安全态势变得越来越复杂&#xff0c;黑客攻击入侵、勒索病…

【JavaWeb】Day37.MySQL概述——数据库设计-DML

数据库操作-DML DML英文全称是Data Manipulation Language(数据操作语言)&#xff0c;用来对数据库中表的数据记录进行增、删、改操作。 1.增加(insert) insert语法&#xff1a; 向指定字段添加数据 insert into 表名 (字段名1, 字段名2) values (值1, 值2); 全部字段添加数据…

回归预测 | MATLAB实现BO-GRNN贝叶斯优化广义回归神经网络多输入单输出预测

回归预测 | MATLAB实现BO-GRNN贝叶斯优化广义回归神经网络多输入单输出预测 目录 回归预测 | MATLAB实现BO-GRNN贝叶斯优化广义回归神经网络多输入单输出预测预测效果基本介绍程序设计参考资料预测效果 基本介绍

如何实现小程序滑动删除组件+全选批量删除组件

如何实现小程序滑动删除组件全选批量删除组件 一、简介 如何实现小程序滑动删除组件全选批量删除组件 采用 uni-app 实现&#xff0c;可以适用微信小程序、其他各种小程序以及 APP、Web等多个平台 具体实现步骤如下&#xff1a; 下载开发者工具 HbuilderX进入 【Dcloud 插…