AI 绘画Stable Diffusion 研究(十二)SD数字人制作工具SadTlaker插件安装教程


免责声明:
本案例所用安装包免费提供,无任何盈利目的。


大家好,我是风雨无阻。


想必大家经常看到,无论是在产品营销还是品牌推广时,很多人经常以数字人的方式来为自己创造财富。而市面上的数字人收费都比较昂贵,少则几千,多则上万。


那么如何才能拥有一个免费的数字人生成工具呢?

其实很简单,只需要在stable diffusion上安装sadtalker插件就能轻松生成自己的数字人。

而且只需简单3步即可!


大家跟着我的步骤,赶紧实操起来,看看效果吧。


注意:本教程适用于秋葉Stable Diffusion整合包的SadTlaker安装。


第一步,SadTlaker 主文件的安装


(1)、浏览器中打开 SadTalker项目地址

https://github.com/OpenTalker/SadTalker

(2)、下载 SadTalker压缩包

在这里插入图片描述


如果下载比较慢,或者无法下载的朋友,可以前往我这里已下载好的sadtalker安装文件。

https://pan.baidu.com/s/15MRdrNnKi7Q0l48jZO_wgg?pwd=mhbz

(3)、安装SadTalker

我们下载SadTalker 后,会得到名字为:SadTalker-main.zip的压缩包。

  • step 1 解压SadTalker-main.zip

  • step 2 重命名为:SadTalker (注意:这里一定要改,不改识别不了)

  • step 3 将SadTalker文件夹拷贝到 sd-webui-aki-v4.2\extensions 目录下

\sd-webui-aki-v4.2\extensions\SadTalker

安装后的目录:

在这里插入图片描述


  • step 4 重启Stable Diffusion

    重启后,可以看到功能栏上,已经出现了SadTalker 标签

    如图:

在这里插入图片描述


第二步,FFmpeg的安装


(1)、什么是ffmpeg ?

FFmpeg是开源的跨平台多媒体处理工具,它可以用于录制、转换音频和视频内容。它包含了一套强大的命令行程序,可以执行各种音视频处理任务,例如格式转换、剪辑、合并、解码、编码、截图等。


(2)、下载ffmpeg

下载ffmpeg可以进入ffmpeg官网下载地址:

https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-full.7z 

如果下载比较慢,或者无法下载的朋友,可以前往我这里已下载好的ffmpeg安装文件。

https://pan.baidu.com/s/196m5bSoUR8DYA03VjnxeeQ?pwd=fxb7

但无论你从哪里下载的ffmpeg文件,都需要给它配置环境变量,才能正常工作。


(3)、解压 ffmpeg 并配置环境变量

我这里直接解压到这个目录,并重新命名为ffmpeg :

C:\Program Files\ffmpeg

在这里插入图片描述


然后需要配置系统环境变量:


  • step 1 我的电脑,鼠标右键菜单,属性->设置

在这里插入图片描述


  • step 2 打开高级系统设置窗口

在这里插入图片描述


  • step 3 打开环境变量窗口

在这里插入图片描述


  • step 4 双击 Path栏,打开编辑环境变量窗口

在最后增加刚才解压后的ffmpeg/bin目录,然后点击确定,保存。

C:\Program Files\ffmpeg\bin

在这里插入图片描述


第三步,Sadtalker模型文件的安装


(1)、下载 Sadtalker模型文件

Sadtalker模型文件 包含 main checkpoints 、gfpgan 可以去Sadtalker官网提供的下载链接下载 。


main checkpoints 下载地址:

https://drive.google.com/file/d/1gwWh45pF7aelNP_P78uDJL8Sycep-K7j/view 

gfpgan 下载地址:

https://drive.google.com/file/d/19AIBsmfcHW6BRJmeqSFlG5fL445Xmsyi/edit

如果下载速度比较慢,也可以去我已经下载好的地址进行下载 。

我准备的gfpgan下载地址:

https://pan.baidu.com/s/1vaqYw-vpreNaNfGUE7wJ3Q?pwd=4efd 

我准备的 Sadtalker checkpoints下载地址:

https://pan.baidu.com/s/1_SXnKa7v8wh1qM2iJOhGwg?pwd=hhat  

(2)、安装checkpoints 和 gfpgan

将下载好的 checkpoints.zip 文件解压到 \sd-webui-aki-v4.2\extensions\SadTalker 目录

注意:如果是在官方网站下载的 checkpoints 压缩包 ,解压后需要重命名为:checkpoints

\sd-webui-aki-v4.2\extensions\SadTalker\checkpoints

如图:

在这里插入图片描述


将下载好的 gfpgan.zip 文件解压到 \sd-webui-aki-v4.2\extensions\SadTalker 目录

\sd-webui-aki-v4.2\extensions\SadTalker\gfpgan

如图:

在这里插入图片描述


至此,Sadtalker 安装就完成了。

下一篇,我们将介绍 Sadtalker 工具的简单使用,制作一个会说话的数字人视频,敬请期待。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/45318.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用yolov5进行安全帽检测填坑指南

参考项目 c​​​​​​​​​​​​​​GitHub - PeterH0323/Smart_Construction: Base on YOLOv5 Head Person Helmet Detection on Construction Sites,基于目标检测工地安全帽和禁入危险区域识别系统,🚀😆附 YOLOv5 训练自己的…

Opencv 视频的读取与写入

目录 前言 通过路径获取视频内容 获取视频内容 检查是否正确打开 循环播放 完整代码 从摄像头读取视频数据 获取视频设备 其他与直接读取视频一致 完整实例 录制视频 用于创建视频编解码器的四字符码(FourCC) cv2.VideoWriter() 将视频帧…

Spring MVC 中的常见注解的用法

目录 认识 Spring MVC什么是 Spring MVCMVC 的定义 Spring MVC 注解的运用1. Spring MVC 的连接RequestMapping 注解 2. 获取参数获取单个参数获取多个参数传递对象表单传参后端参数重命名RequestBody 接收 JSON 对象PathVariable 获取 URL 中的参数上传文件 RequestPart获取 C…

C++系列-内存模型

内存模型 内存模型四个区代码区全局区栈区堆区内存开辟和释放在堆区开辟数组 内存模型四个区 不同区域存放的数据生命周期是不同的,更为灵活。 代码区:存放函数体的二进制代码,操作系统管理。全局区:存放全局变量,常…

AutoSAR配置与实践(基础篇)2.5 RTE对数据一致性的管理

传送门 点击返回 ->AUTOSAR配置与实践总目录 AutoSAR配置与实践(基础篇)2.5 RTE对数据一致性的管理 一、 数据一致性问题引入二、 数据一致性的管理2.1 RTE管理 (SWC间)2.2 中断保护 (SWC内)2.3 变量保护IRVS (SWC内)2.4 Task分配2.5 任务抢占控制 一…

【linux】kernel编译时相关报错

文章目录 1. 问题现象及解决方式1. cc1: error: code model kernel does not support PIC mode 1. 问题现象及解决方式 1. cc1: error: code model kernel does not support PIC mode 问题:编译module时报错 原因:未指定交叉编译器,导致默认…

44、TCP报文(二)

接上节内容,本节我们继续TCP报文首部字段含义的学习。上节为止我们学习到“数据偏移”和“保留”字段。接下来我们学习后面的一些字段(暂不包含“检验和”的计算方法和选项字段)。 TCP首部结构(续) “数据偏移”和“保…

什么是LLM大语言模型?

什么是LLM大语言模型? 大语言模型(英文:Large Language Model,缩写LLM),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练&#xff0…

525. 连续数组

525. 连续数组 原题链接:完成情况:解题思路:参考代码: 原题链接: 525. 连续数组 https://leetcode.cn/problems/contiguous-array/description/ 完成情况: 解题思路: 参考代码: …

解放数据库,实时数据同步利器:Alibaba Canal

文章首发地址 Canal是一个开源的数据库增量订阅&消费组件,主要用于实时数据同步和数据订阅的场景,特别适用于构建分布式系统、数据仓库、缓存更新等应用。它支持MySQL、阿里云RDS等主流数据库,能够实时捕获数据库的增删改操作&#xff…

JVM——垃圾回收(垃圾回收算法+分代垃圾回收+垃圾回收器)

1.如何判断对象可以回收 1.1引用计数法 只要一个对象被其他对象所引用,就要让该对象的技术加1,某个对象不再引用其,则让它计数减1。当计数变为0时就可以作为垃圾被回收。 有一个弊端叫做循环引用,两个的引用计数都是1&#xff…

如何用树莓派Pico针对IoT编程?

目录 一、Raspberry Pi Pico 系列和功能 二、Raspberry Pi Pico 的替代方案 三、对 Raspberry Pi Pico 进行编程 硬件 软件 第 1 步:连接计算机 第 2 步:在 Pico 上安装 MicroPython 第 3 步:为 Thonny 设置解释器 第 4 步&#xff…

C 语言的 strcpy() 函数和 strncpy() 函数

文章目录 strcpy() 函数strncpy() 函数 strcpy() 函数 <string.h> char *strcpy(char *dest, const char *src) 参数 dest – 指向用于存储复制内容的目标数组。 src – 要复制的字符串。 把 src 所指向的字符串复制到 dest。 需要注意的是如果目标数组 dest 不够…

【ARM-Linux】项目,语音刷抖音项目

文章目录 所需器材装备操作SU-03T语音模块配置代码&#xff08;没有用wiring库&#xff0c;自己实现串口通信&#xff09;结束 所需器材 可以百度了解以下器材 orangepi-zero2全志开发板 su-03T语音识别模块 USB-TTL模块 一个安卓手机 一根可以传输的数据线 装备操作 安…

高项4.项目管理核心技术.

第一部分 项目管理概论 价值驱动的项目管理知识体系: 十二项原则;生命周期四个阶段;五个过程组;十大PM知识领域;八大绩效域;外加价值交付系统; 自1987 年以来, PMBOK 一直是基于过程的项目管理标准的重要代表,项目管理从业者一 直坚持基于过程的项目管理方法。随着…

2023-8-20 单链表

题目链接&#xff1a;单链表 #include <iostream>using namespace std;const int N 100010;int head, e[N], ne[N], idx;void init() {head -1;idx 0; }// 将x插入到头结点 void add_to_head(int x) {e[idx] x;ne[idx] head;head idx;idx; }// 将x插入到下标k后面…

VGG分类实战:猫狗分类

关于数据集 数据集选择的是Kaggle上的Cat and Dog&#xff0c;猫狗图片数量上达到了上万张。你可以通过这里进入Kaggle下载数据集Cat and Dog | Kaggle。 在我的Github仓库当中也放了猫狗图片各666张。 VGG网络 VGG的主要特点是使用了一系列具有相同尺寸 3x3 大小的卷积核进…

Android glide框架及框架涉及到的设计模式

目录 原文链接Android glide框架 简单使用介绍Glide 框架整体结构设计Glide 框架的优点基本使用&#xff1a;Glide占位符 Android glide框架涉及到的设计模式 原文链接 Android glide框架 简单使用介绍 Glide&#xff1a;快速高效的Android图片加载库&#xff0c;可以自动加载…

LLM低成本微调方法

LLM日益流行&#xff0c;已经渗透到各个领域&#xff0c;比如生物医学&#xff0c;但是模型的规模导致微调LLM对普通用户不够友好&#xff0c;因此&#xff0c;我们需要借助一些低成本方法&#xff0c;通过更新少量参数也达到与LLM全参数更新一样的效果。这里介绍三种主流方法&…

改善神经网络——优化算法(mini-batch、动量梯度下降法、Adam优化算法)

改善神经网络——优化算法 梯度下降Mini-batch 梯度下降&#xff08;Mini-batch Gradient Descent&#xff09;指数加权平均包含动量的梯度下降RMSprop算法Adam算法 优化算法可以使神经网络运行的更快&#xff0c;机器学习的应用是一个高度依赖经验的过程&#xff0c;伴随着大量…