教你用SadTalker一键整合包轻松制作专属数字人

数字人的效果: 

🎵我用SadTalker制作了专属虚拟数字人,还会唱歌哦,多多点赞关注就出教程呦💗

SadTalker有独立离线版Ai数字人,也可以在Stable Diffusion以插件的形式使用,但是如果显卡小的话还是建议使用独立版,毕竟Stable Diffusion也要占用显卡。

我在逛B站时,找到了一键整合包,直接下载双击启动就可以使用,非常方便,那么安装包可以如下方式下载。

百度网盘:百度网盘 请输入提取码

夸克链接(不限速):https://pan.quark.cn/s/129af21d115d

B站:Ai应用分享站丨Danny

先说下我的显卡,大家参考下,我的显卡是6G,10秒内的音频转换数字人需要一分钟左右,我的显卡就不能选择高清了,选择高清就卡的不行。

 下载下来解压,目录内容如下:

我们进入SadTalker里的ffmpeg文件夹,这里我们需要按如下方式先配置下环境变量,

然后进入SadTalker目录里点击一键启动,弹出CMD,等待CMD里出现WEB UI的路径地址,复制地址到网页上就可以了。

界面如下,左部分是原文件上传,右上部分是进行数字人转换时参数的设置,右下部分是生成数字人后显示的地方。

素材准备

首先我们准备图片,可以真人,动漫都可以,最好是正面头像,(测试后最好是咧嘴微笑的照片口型更自然,紧闭双唇嘴部运动效果不明显,)有些图片效果不好,可以多换些图片,有的效果很好,然后图片可以是SD生成图片,也可以你本人照片,或者网图。

语音准备,我是在在线的文本转语音工具,这个工具还蛮不错的,不用登录什么的,可以直接使用,界面如下,

在线免费文字转语音 - TTSMaker官网 | 马克配音

 转换成功,可以点击下载文件到本地,全程不用其他登录注册操作,这点简直太棒了!

 

上传图片和声音直接点击生成,等待片刻,控制台就开始处理,

参数说明:

  • Pose style:视频人物的姿势,姿势变化种类。
  • face model resolution:视频分辨率,小显卡老老实实的256,我试过512界面直接卡的不行,而且生成时间比较长。
  • preprocess:图片处理方式,包括crop/resize/full/extcrop/extfull

          crop:从图片中截取头部生成视频

          resize:拉伸,适合大头照或证件照

          full:保留全身,全身照生成视频

          extcrop:加强版裁剪主要聚焦头部,试了下,小显卡效果还是不行

          extfull:加强版全身,试了下,小显卡效果还是不行

  • still mode:减少头部运动,负面效果就是头不怎么动了,按自己需求使用。
  • batch size in generation:同时处理数,越大处理越快,但是也废显存,看GPU能力。
  • GFPGAN as Face enhancer:修脸,基于gfpgan对视频增强。

 执行转换时的控制台,此时转换完毕。

 因为我们选择的默认的crop,所以就裁剪了头部,视频截图如下。

如果全身图的效果,就是眼睛效果不太好,一直有点眯眯眼,然后测试了多个发现微笑以及咧嘴笑的生成效果最好,嘴部说话效果最好。

 选择了resize就崩了,哈哈哈,但是这个分图片,有的图片选择resize就可以。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/611536.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开始卷TED:第1篇 —— 《Embrace the near win》—— part: 3

She first hit a seven, I remember, and then a nine, and then two tens, and then the next arrow didn’t even hit the target. 她第一次射中了7环, 我记得接下来是个9环,然后是2个十环,接下来的那支箭甚至没有射到靶上。 And I saw tha…

强化学习10——免模型控制Q-learning算法

Q-learning算法 主要思路 由于 V π ( s ) ∑ a ∈ A π ( a ∣ s ) Q π ( s , a ) V_\pi(s)\sum_{a\in A}\pi(a\mid s)Q_\pi(s,a) Vπ​(s)∑a∈A​π(a∣s)Qπ​(s,a) ,当我们直接预测动作价值函数,在决策中选择Q值最大即动作价值最大的动作&…

【Vue3】2-4 : 声明式渲染及响应式数据实现原理

本书目录:点击进入 一、声明式渲染 1.1 什么是JS表达式:能够进行赋值的操作 ▶ 正确 ▶ 错误示例 二、示例:2秒后,页面中 message 由 hello world 变成 hi vue ▶ 效果 三、原理:利用ES6的Proxy对象对底层进…

Linux网络编程(一-网络相关知识点)

目录 一、网络相关知识简介 二、网络协议的分层模型 2.1 OSI七层模型 2.2 TCP/IP五层模型 2.3 协议层报文间的封装与拆封 三、IP协议 3.1 MAC地址 3.2 IP地址 3.3 MAC地址与IP地址区别 一、网络相关知识简介 互联网通信的本质是数字通信,任何数字通信都离…

千问写作——论文写作

【千问写作】 千问写作是运用通义千问720亿参数的语言模型(qwen-72b-chat)进行基于目录的论文创作,通过python-docx设置文档格式然后写出文档 ,其他免费模型(qwen-1.8b-chat)暂时无法生成目录 1. 请求延时 …

Docker实战10|实现volum数据卷

上一篇文章中,仔细讲解了Docker是如何改变当前的root文件系统以及mount等操作。 本文继续讲解Docker是如何实现Volum数据卷的。 实现Volume数据卷 获取代码 git clone https://gitee.com/mjreams/docker.git 上一小节介绍了如何使用AUFS包装busybox&#xff0c…

Windows11快速安装Android子系统

很多小伙伴想在电脑运行一下安卓程序,或则上班用手机摸鱼不方便,用电脑又没有想要的手机软件,那么怎么用电脑来安装安卓软件呢? 首先设置地区 安装Android子系统的前提需要安装 Amazon Appstore 这个应用,内地不能下载…

【博士每天一篇论文-算法】Optimal modularity and memory capacity of neural reservoirs

阅读时间:2023-11-15 1 介绍 年份:2019 作者:Nathaniel Rodriguez 印第安纳大学信息学、计算和工程学院,美国印第安纳州布卢明顿 期刊: Network Neuroscience 引用量:39 这篇论文主要研究了神经网络的模块…

SpringBoot+Redis实现接口防刷功能

场景描述: 在实际开发中,当前端请求后台时,如果后端处理比较慢,但是用户是不知情的,此时后端仍在处理,但是前端用户以为没点到,那么再次点击又发起请求,就会导致在短时间内有很多请求…

RK3568平台开发系列讲解(Linux系统篇)Linux 内核打印

🚀返回总目录 文章目录 一、方法一:dmseg 命令二、方法二:查看 kmsg 文件三、方法三:调整内核打印等级一、方法一:dmseg 命令 在终端使用 dmseg 命令可以获取内核打印信息,该命令的具体使用方法如下所示: 首先在串口终端使用 “dmseg”命令,可以看见相应的内核打印信息…

Windows.OpenSSL生成ssl证书配置到nginx

一、下载OpenSSL程序安装 到E:\soft\OpenSSL-Win64 二、打开一个CMD控制台窗口,设置好openssl.cnf路径 E: cd E:\soft\OpenSSL-Win64\bin set OPENSSL_CONFE:\soft\OpenSSL-Win64\bin\openssl.cnf 三、在当前目录 E:\soft\OpenSSL-Win64\bin 里创建两个子目录 m…

酿酒生产废水处理设备如何选型

选型酿酒生产废水处理设备是确保废水处理过程高效稳定的关键步骤。酿酒生产过程中,产生的废水中含有大量有机物和悬浮物,因此需要选择适合的设备来进行处理。 首先,要根据酿酒生产废水的特点进行选型。酿酒废水的主要特点是:水量较…

phpstorm配置ftp

1 选择设置ftp 2设置自动上传

分享两个概念:非受检异常和受检异常

分享两个概念:非受检异常和受检异常 愿你的每一天都充满阳光和笑声,愿每一步都是轻松与愉快。在新的旅程中,愿你找到勇气攀登高峰,找到智慧化解困境。 愿你的心中充满温暖和善意,愿你的梦想如彩虹般美丽且真实。愿你发…

阿里云ECS服务器安装了数据库,nginx 等,已经启动,但是浏览器,navicat 访问不了

目录 1 问题2 实现 1 问题 阿里云ECS服务器安装了数据库,nginx 等,已经启动,但是浏览器,navicat 访问不了; 防火墙也关闭了,使用命令已经进入数据库了,说明数据库已经安装成功了,但…

Android开发基础(一)

Android开发基础(一) 本篇主要是从Android系统架构理解Android开发。 Android系统架构 Android系统的架构采用了分层的架构,共分为五层,从高到低分别是Android应用层(System Apps)、Android应用框架层&a…

Python实现PDF—>Excel的自动批量转换(附完整代码)

Python实现PDF—>Excel的自动批量转换(附完整代码) 话不多说,先看效果! 需要转换的PDF: 转换后的Excel: 01、底层原理 PDF 到 Excel 的转换涉及不同文件格式之间的数据提取和重构。底层原理可以简…

Flask 菜品管理

common/libs/Helper.py getDictFilterField() 方法 用于在web/templates/food/index.html中展示菜品分类 如何能够通过food里面的cat_id获取分类信息呢?只能通过for循环,这样会很麻烦,所以定义了这个方法。 这个方法可以的查询返回结果…

linux 01 centos镜像下载,服务器,vmware模拟服务器

https://www.bilibili.com/video/BV1pz4y1D73n?p3&vd_source4ba64cb9b5f8c56f1545096dfddf8822 01.使用的版本 国内主要使用的版本是centos 02.centos镜像下载 这里的是centos7 一.阿里云官网地址:https://www.aliyun.com/ 二. -----【文档与社区】 —【…

CSND修改付费专栏价格

人工客服在个人中心右下角可以找到 客服回复已订阅专栏不支持修改价格