【Stable Diffusion】入门-04:不同模型分类+代表作品+常用下载网站+使用技巧

目录

  • 1 模型简介
  • 2 模型文件构成和加载位置
    • 2.1 存储位置
    • 2.2 加载模型
  • 3 模型下载渠道
    • 3.1 HuggingFace
    • 3.2 Civitai
  • 4 模型分类
    • 4.1 二次元模型
    • 4.2 写实模型
    • 4.3 2.5D模型

1 模型简介

拿图片给模型训练的这个过程,通常被叫做“喂图”。模型学习的内容不仅包括对具体事物的形象描绘,还包括对它们的呈现方式(画风)。如果我们喂给模型的图片都是二次元风格的,那你让它画人画风景,它都会画得像一幅二次元插画;如果喂的图片都是真实世界里的照片,那它生成的图片就是偏真实场景的。
使用不同风格的模型,就能生成不同风格的作品。

2 模型文件构成和加载位置

2.1 存储位置

在Stable Diffusion里,模型被存储在./models/Stable-diffusion/文件夹里,如果下载了新的模型文件,需要复制到该文件下,SD就可以自动加载该模型。模型有固定的称呼,叫做checkpoint,即检查点或者关键点模型,可以理解为游戏中的存档,模型训练到某个关键位置时,就会建立一个关键点来保持已经训练的部分,以后方便回滚和继续训练。

模型通常很大,一般占用37GB,文件名后缀通常是`.ckpt`,我们常把这种GB级别的模型叫做“大模型”。还有一种大模型的后缀是`.safetensors`,占用空间会小一点,通常12GB。SD里这两种模型都可以使用。

2.2 加载模型

如果是在WebUI打开的状态下添加了新模型,需要先点击左上角右边那个刷新按钮,新的模型才能被显示进来,再选择对应的模型即可。
选择模型
需要看命令行里的加载进度,跳出这样的提示才算加载成功:

Reusing loaded model v1-5-pruned.ckpt [e1441589a6] to load v1-5-pruned-emaonly.ckpt [cc6cb27103]
Loading weights [cc6cb27103] from D:\Projects\stable-diffusion-webui\models\Stable-diffusion\v1-5-pruned-emaonly.ckpt
Applying attention optimization: Doggettx… done.
Weights loaded in 4.6s (send model to cpu: 0.8s, load weights from disk: 2.8s, apply weights to model: 0.3s, move model to device: 0.6s).
加载进度

模型加载成功后才能开始生图。

有的UI页面在模型选择栏右边有个VAE的选项,全称叫做变分自编码器,负责将加噪后的数据转换成正常的图像。可以粗略理解成AI作画的一种“调色滤镜”,最直观地影响画面的色彩质感。目前大部分新的模型已经把VAE整合进大模型文件里了,少数会没有整合的会推荐使用特定的VAE,使得生成的图片质感更好。VAE文件的放置路径是同models文件下的VAE文件夹里./models/VAE/。可以将VAE模型的文件名修改成和对应大模型一样的名字,再在VAE选项里选择“自动”,这样就可以针对不同模型自动切换VAE。我们使用的UI没有VAE选项,故不做展开介绍。

3 模型下载渠道

市面上大多数SD使用者用来作图的模型,都是由个人训练并发布的,俗称“私炉模型”。大家会把训练AI学习图片生成模型这件事叫做“炼丹”,炼丹有一定的技术门槛和硬件需求,因此只有拥有一口好的“炼丹炉”才能成为炼丹师。由于版权问题,官方的炉在学习的素材来源和尺度上都有着比较大的约束,所以利用私炉作画出图时目前的主流趋势,但它的版权确实会存在争议。

目前AI绘画主流的模型下载网站有两个:Huggingface和Civitai。

3.1 HuggingFace

HuggingFace,俗称抱脸。它是一个允许用户共享AI学习模型和数据集的平台,包含的内容非常广:AI绘画和其他AI领域的内容。
Huggingface

  1. 在最上方的搜索栏里输入Stable Diffusion,可以直接下载发布的历代官方模型。
    sd官方模型

  2. 在左边的工具栏里,点亮Text-to-Image标签,就能筛选出其他用户发布的主要被用于AI作画的问生图模型了,包括许多老牌知名模型:WaifuDiffusion、Anything、DreamShaper等。
    文生图模型

  3. 选择其中一个点进去,会有一个“Model Card”,相当于这个模型的介绍页面;
    model card

  4. 切换到第二个标签“Files and versions”,制作者们会把文件、源代码等文件放到不同的文件夹里。
    Files

  5. 到对应的文件夹里寻找需要的文件,点击就可以下载。
    下载模型

  6. 切换到“Community”,可以进入对这个模型感兴趣的使用者们的交流区,如果有什么建议,或者遇到什么bug,可以到交流区里看看是否有解决方式,或者点击左边的PR & discussions documentation发起讨论。
    交流区

市面上一些知名的模型,都可以来Huggingface搜一下看看。

3.2 Civitai

Civitai,俗称C站,是一个AI绘画模型的分享平台,里面各种模型的展示是非常图像化和具体化的。在C站上访问和下载模型均不需要注册。
Civitai

  1. 点击“Models”进入模型页面,点击右上方模型排序选项,选择“Highest Rate”或者“Most Downloaded”,就可以看到目前最火热的一系列AI绘画模型了。
    排序
  2. 可以对这些模型进一步细分筛选:
    – 基于模型类型,点击右上角小漏斗按钮,可以根据不同选项对模型进行筛选。
    筛选
    – 基于特定内容类型,页面上方有一系列标签,代表着不同的风格类目和内容方向,例如:动画、角色设计、女性、名人、插画、卡通、男性、自然景观等。
    内容类型
  3. 选择其中一个模组,进入后右边是下载按钮,如果有不同的版本,可以到下面的Files选择下载哪个。页面底下的模组介绍,相当于Huggingface里的Model Card,最好在作图前仔细阅读一遍,作者会从很多方面指导你如何使用该模型,例如:适合的风格、关键词、分辨率以及VAE,点击其中的链接都可以直接跳转下载。

下载页面

  1. C站作为模型分享网站,不仅仅分享模型,还分享用这些模型做出来的作品。模型页面的正上方,都有一系列作者使用这个模型生成的例图,点击图片右下方的信息按钮,就会跳出对应的提示词、采样方法、随机种子等等详细的参数。如果你要抄作业,那这就是一份参考答案,可以给你产出最接近模型作者理想中的效果。

作图信息

  1. 再往下翻,可以看到C站上其他用户上传的基于这个模型产出的图片,里面大部分都会同样附上提示词和参数。
    图库

  2. C站的首页还有一系列页面,例如:“Image”页面,点进去,可以欣赏到那些高赞好评的AI绘画作品,并找到它们对应的使用模型和提示词、参数。其他的页面也是一些高赞的作品。

图片网页

4 模型分类

下面介绍几种不同类型模型对应的代表模型和搜索关键词,也可以使用这些搜索关键词在Prompt中激活模型风格特性。

4.1 二次元模型

偏漫画、插画风格的,具有鲜明的绘画笔触质感,代表作:Anything、Counterfeit、Dreamlike Diffusion等。
搜索标签与风格关键词:illustration, painting, sketch, drawing, comic, anime, cartoon.

4.2 写实模型

偏真实系、拟真化程度高的、对现实世界还原强,代表作:Deliberate、Realistic Vision、LOFI等。
搜索标签与风格关键词:photography, photo, realistic, photorealistic, RAW photo.

4.3 2.5D模型

介于二次元和写实模型之间,还原出来的质感效果类似于一些建模软件里能制作出来的三维渲染图,接近目前一些游戏和3D动画的风格,代表作:NeverEnding Dream、Protogen、国风V3等。
搜索标签与风格关键词:3D, render, chibi, digital art, concept art, {realistic}.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/749929.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux中 vim 编辑器的使用

文章目录 前言一、vim编辑器模式二、简单的插入、保存和退出三、 命令模式下常用命令即其作用1. 命令模式 思维导图 前言 首先,了解一下 什么是vim 编辑器?在不同的系统中,文本的管理也会不同;windos系统就不多说了&#xff0c…

compile→错误: 不支持发行版本 17

错误: 不支持发行版本 17 具体错误描述如下: [ERROR] Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.11.0:compile (default-compile) on project big-event: Fatal error compiling: 错误: 不支持发行版本 17 -> [Help 1] [ERROR] …

简易版 RPC 框架实现 1.0 -http实现

RPC 是“远程过程调用(Remote Procedure Call)”的缩写形式,比较通俗的解释是:像本地方法调用一样调用远程的服务。虽然 RPC 的定义非常简单,但是相对完整的、通用的 RPC 框架涉及很多方面的内容,例如注册发…

Redisson 分布式锁原理分析

Redisson 分布式锁原理分析 示例程序 示例程序: public class RedissonTest {public static void main(String[] args) {Config config new Config();config.useSingleServer().setPassword("123456").setAddress("redis://127.0.0.1:6379"…

cool 中的Midway ----node.js的TypeORM的使用

1.介绍 TypeORM | Midway TypeORM 是 node.js 现有社区最成熟的对象关系映射器(ORM )。本文介绍如何在 Midway 中使用 TypeORM 相关信息: 描述可用于标准项目✅可用于 Serverless✅可用于一体化✅包含独立主框架❌包含独立日志❌ 和老写…

第二十四天-数据可视化Matplotlib

目录 1.介绍 2.使用 1. 安装: 2.创建简单图表 3.图表类型 1.一共分为7类 2.变化 1.折线图 3.分布 ​编辑 1.直方图 2.箱型图 4.关联 1. 散点图: 2.热力图: 5.组成 1.饼图 2.条形图 6.分组 1.簇型散点图 2.分组条形图 3.分…

JOSEF约瑟 TQ-100同期继电器 额定直流电压220V 交流电压100V±10V

TQ-100型同期继电器 TQ-100同期继电器 ​ l 应用 本继电器用于双端供电线路的自动重合闸和备用电源自投装置中,以检查线路电压与母线电压的 相位差和幅值差。 2 主要性能 2 1采用进口集成电路和元器件构成,具有原理先进、性能稳定、可靠性高、动作值精…

Git版本管理--远程仓库

前言: 本文记录学习使用 Git 版本管理工具的学习笔记,通过阅读参考链接中的博文和实际操作,快速的上手使用 Git 工具。 本文参考了引用链接博文里的内容。 引用: 重学Git-Git远程仓库管理_git remote add origin-CSDN博客 Git学习笔记&am…

[自研开源] MyData 数据集成之数据过滤 v0.7.2

开源地址:gitee | github 详细介绍:MyData 基于 Web API 的数据集成平台 部署文档:用 Docker 部署 MyData 使用手册:MyData 使用手册 试用体验:https://demo.mydata.work 交流Q群:430089673 概述 本篇基于…

javaEE——线程的等待和结束

文章目录 Thread 类及常见方法启动一个线程中断一个线程变量型中断调用 interrupt() 方法来通知观察标志位是否被清除 等待一个线程获取当前线程引用休眠当前线程 线程的状态观察线程的所有状态观察 1: 关注 NEW 、 RUNNABLE 、 TERMINATED 状态的切换 多线程带来的风险为什么会…

【大模型系列】问答理解定位(Qwen-VL/Llama2/GPT)

文章目录 1 Qwen-VL(2023, Alibaba)1.1 网络结构1.2 模型训练 2 Llama2(2023, Meta)2.1 网络结构2.1.1 MHA/GQA/MQA2.1.2 RoPE(Rotary Position Embedding, 旋转式位置编码)2.1.3 RMSNorm 2.2 推理2.2.1 集束搜索(beam search)2.2.2 RoPE外推 3 GPT系列(OpenAI) 1 Qwen-VL(2023…

android中单例模式为什么会引起内存泄漏?

单例模式使用不恰当会造成内存泄漏。因为单例的静态特性使得单例的生命周期和应用的生命周期一样长, 如果一个对象已经不需要使用了,但是单例对象还持有该对象的引用,那么这个对象就不能被正常回收,因此会导致内存泄漏。 举个例子…

【数据可视化】使用Python + Gephi,构建中医方剂关系网络图!

代码和示例数据下载 前言 在这篇文章中,我们将会可视化 《七版方剂学》 的药材的关系,我们将使用Python制作节点和边的数据,然后在Gephi中绘制出方剂的网络图。 Gephi是一个专门用于构建网络图的工具,只要你能提供节点和边的数…

Stable Diffusion科普文章【附升级gpt4.0秘笈】

随着人工智能技术的飞速发展,我们越来越多地看到计算机生成的艺术作品出现在我们的生活中。其中,Stable Diffusion作为一种创新的图像生成技术,正在引领一场艺术创作的革命。本文将为您科普Stable Diffusion的相关知识,带您走进这…

Flink 集群部署模式

文章目录 前言一、会话模式(Session Mode)二、单作业模式(Per-Job Mode)三、应用模式(Application Mode) 前言 Flink支持多种集群部署模式,以满足不同场景和需求。以下是Flink的主要集群部署模…

springboot多模块下swaggar界面出现异常(Knife4j文档请求异常)或者界面不报错但是没有显示任何信息

继上一篇博文,我们解决了多模块下扫描不到子模块的原因,建议先看上一个博客了解项目结构: springboot 多模块启动报错Field XXX required a bean of type XXX that could not be found. 接下来我们来解决swaggar异常的原因,我们成功启动项目…

QML 布局管理器之ColumnLayout

一.ColumnLayout讲解 QML中的ColumnLayout是一种布局元素,用于在垂直列中排列其子元素。它的主要使用下列附加属性: Layout.minimumWidth Layout.minimumHeight Layout.preferredWidth Layout.preferredHeight Layout.maximumWidth Layout.maximumHeight Layout.fil…

SqlServer2008(R2)(一)SqlServer2008(R2)经典宝藏操作收集整理

一、常见操作 1、TRUNCATE TABLE 语句 删除表数据 TRUNCATE TABLE语句比DELET删除表中的所有行更快。从逻辑上讲,TRUNCATE TABLE它类似于DELETE没有WHERE子句的语句。 TRUNCATE TABLE语句从表中删除所有行,但表结构及其列,约束,…

Ubuntu 20.04 系统如何优雅地安装NCL?

一、什么是NCL? NCAR Command Language(NCL)是由美国大气研究中心(NCAR)推出的一款用于科学数据计算和可视化的免费软件。 它有着非常强大的文件输入和输出功能,可读写netCDF-3、netCDF-4 classic、HDF4、b…

Xinstall助力web唤起iOS,打破平台壁垒,实现无缝跳转

在移动互联网时代,web与App之间的跳转已成为用户日常使用中不可或缺的一部分。然而,对于iOS系统的用户来说,web唤起App的过程往往充满了挑战和不便。这时,Xinstall作为一款专业的移动开发者服务工具,为开发者们提供了解…