3D数字人视频合成用户指南

数字人开放平台3D互动数字人如何接入_虚拟数字人(DVH)-阿里云帮助中心3D互动数字人(对应开放平台的“智能客服”场景)是虚拟数字人开放平台提供能够支持用户与3D数字人进行实时语音交互的数字人产品能力,需要配合智能对话机器人产品使用。本篇文档将介绍如何接入3D互动数字人。icon-default.png?t=N7T8https://help.aliyun.com/zh/avatar/avatar/developer-reference/integrate-3d-interactive-dvh

1 进入视频合成页面

进入数字人开放平台控制台,点击视频合成-新建视频,选择3D形象进入视频合成页面。

image.png

image.png

2 视频设置

2.1 数字人

点击数字人,可在此重新选择数字人形象。

image

鼠标悬浮在某一形象上方,显示【形象配置】按钮,此时点击将前往资产中心-3D数字人资产,可在此页面对数字人形象进行配置,如发型、妆容、服装、声音等。

2.2 声音

点击声音,可选择数字人播报的音色并调整音色对应的音量、语速和音调,目前平台提供四个类别的音色:男声、女声、童声以及方言;多情感音色支持在文本编辑器中针对文本进行情绪化的编辑,详见3.1节语音编辑;带星号的音色为使用频率较高的音色。

image

2.3 背景图

点击背景图,可选择平台内置的背景,包括透明背景;同时可上传自定义背景,上传时请注意背景图大小要求。

image

2.4 字幕

点击字幕,根据需要打开或者关闭字幕开关,可调整字幕样式,如字体、字号、字体颜色、描边颜色。

image

2.5 尺寸

在预览画面上方,可选择尺寸,目前平台支持两种尺寸:16:9、9:16。

2.6 调整数字人在画面中的大小以及位置

在左侧的预览画面中,通过鼠标拖拽数字人,可移动数字人,调整其在画面中位置;另外平台提供了远景、近景和特写三种景别以及正面、左侧30°和右侧30°三种机位,用户可在预览画面中看到相应的效果并选择适合的组合。

image.png

image

image

3 播报内容输入

3.1 文本输入

选择文本输入,您可在文本框中输入希望数字人播报的文本来制作视频。

3.1.1 语音合成的编辑功能
  1. 文本输入框集成了语音合成的编辑器功能,可在该编辑器中对语音合成进行人工的调整,例如标注多音字、标注文本读法、标注数值读法等,详见下表。

  2. 同时文本输入框集成了情绪化音色的编辑能力,可在编辑器中选中某段文本并选择需要的情绪,详见下表。注意:该功能需要在声音设置中选择多情感音色。

功能

子功能

备注

操作方法

多音

/

/

弹出浮层高亮多音字,逐一标注

文本

人名

姓氏自动匹配、连续

划选文字后选择读法

地址

示例:2单元301读作二单元三零幺

标点符号

读标点本身发音

ID

读字母和数值

日期

示例:2019/10/21读作二零一九年十月二十一日

时间

示例:01:13:43读作一点十三分四十三秒

计量单位

示例:mm读作毫秒(在阿里云语音合成服务中会将mm读作毫秒)

数值

读数值

示例:123读作一百二十三

划选数字文本后选择读法

读数字

示例:123读作一二三

读手机号

示例:13900001111

读作幺三九<停顿0.5s>零零零零<停顿0.5s>幺幺幺幺

英文

读字母

每个字母分开发音

划选英文文本后选择读法

连续

/

选中的文本连续发音

划选需要调整的文本

停顿

0.5s

停顿0.5s

在光标位置插入停顿

1s

停顿1s

2s

停顿2s

情绪

生气

/

划选文字后选择情绪,默认为自然情绪

害怕

开心

厌恶

悲伤

惊讶

插入日期

/

/

在光标位置插入当前日期

插入时间

/

/

在光标位置插入当前时间

试听

/

/

划选需要试听的文本进行试听(需完成声音设置)

3.1.2 动作编辑

文本输入框也集成了动作编辑的功能,可在文本中插入数字人动作。目前支持两种形式的插入:(1)自定义动作,用户可以选择该数字人的动作进行自主插入。在自定义动作时,也可以点击"推荐插入",此时系统将会自动将推荐的动作插入文本中,用户可以在此基础上再次对动作进行修改;(2)智能动作,点击后不会在编辑器中显示动作标签,算法将会根据语义,在合成过程中匹配合适的动作。

image.png

3.2 音频输入

选择音频输入,您可上传本地的音频文件,为保证效果,请上传在安静环境下录制的播报人声。此时生成视频中的声音即为上传的音频。

4 生成视频

4.1 生成视频

点击生成视频,将根据输入的文本生成数字人播报的视频;视频生成时间根据输入的文本长度而定。生成好的视频会在视频管理中展示,可在该页面下进行视频的下载;平台支持生成MOV和MP4格式的视频,其中选择透明背景,生成的MOV视频可以直接在第三方剪辑软件中二次加工;而选择MP4格式将同时导出两个视频,一个为带黑灰色背景的视频,另一个为alpha通道视频,可在专业剪辑软件中通过遮罩功能去除原视频中的背景以获得透明背景的效果。需要注意的是,不管背景是否透明,选择生成MOV格式将会需要较长的渲染时间,且生成的视频也会较大。

4.2 存为草稿

点击存为草稿可将目前的设置和输入的文本存为草稿,草稿将在视频管理中展示,可以继续进入原草稿进行编辑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/35066.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安装appnium

官网&#xff1a; https://appium.io/docs/en/latest/quickstart/uiauto2-driver/ 安装Node.js 首先&#xff0c;确保安装了Node.js&#xff0c;因为Appium是基于Node.js的。可以从Node.js官网下载并安装最新稳定版。安装Appium Server 你可以通过npm&#xff08;Node.js的包管…

徐徐拉开的帷幕:拜登与特朗普的辩论大戏 日元跌破160大关!创1986年以来最低纪录

北京时间6月27日&#xff08;本周五&#xff09;上午9:00&#xff0c;拜登和特朗普将参加2024年总统候选人电视辩论。作为参考&#xff0c;2016年大选辩论期间&#xff0c;美元汇率对辩论结果的反应相对温和&#xff0c;希拉里胜选预期增强在一定程度上支撑了美元。 时间逐渐临…

Java - 程序员面试笔记记录 实现 - Part1

社招又来学习 Java 啦&#xff0c;这次选了何昊老师的程序员面试笔记作为主要资料&#xff0c;记录一下一些学习过程。 1.1 Java 程序初始化 Java 程序初始化遵循规则&#xff1a;静态变量优于动态变量&#xff1b;父类优于子类&#xff1b;成员变量的定义顺序&#xff1b; …

python运行相关

一、check python是否仍然在运行 Windows 操作系统下用任务管理器查看 打开任务管理器&#xff1a;Ctrl Shift Esc 查看进程列表&#xff1a; 在“进程”选项卡中&#xff0c;找到与 Python 相关的进程。 检查CPU和内存使用情况&#xff1a; 如果数值在不断变化&#xf…

Spring的jar包下载(最新版6.0版本)

1.在Spring官网的projects下面点击spring-framework 2.进入github官网 3.进入github后往下滑&#xff0c;点击Spring Framework Artifacts 4.往下滑找到 点击 5.在左边先点击Artifacts&#xff0c;在右边找到 libs-snapshot&#xff0c;展开libs-snapshot&#xff08;之前其他…

React Hooks小记(九)_useMemo 和 memo 函数

useMemo 和 memo 函数 1. memo 函数 当父组件被重新渲染的时候&#xff0c;也会触发子组件的重新渲染&#xff0c;这样就多出了无意义的性能开销。如果子组件的状态没有发生变化&#xff0c;则子组件是必须要被重新渲染的。 在 React 中&#xff0c;我们可以使用 React.memo…

k8s及常用对象简介

文章目录 一、k8s是什么应用程序早期部署形式容器的引入k8s的作用 二、k8s中的常用对象1、Node获取node信息 2、Namespacenamespace的使用 3、Pod生命周期pod的使用 4、DaemonSetDaemonSet的使用 5、Deployment创建deploy 6、ReplicaSet7、StatefulSet创建StatefulSet 8、更新操…

免费代理池,在线公共ip池

这些公共代理是完全免费提供的&#xff0c;不需要任何授权。 免费代理通常是开放的、流行的公共代理。 与私人代理不同&#xff0c;公共代理不需要注册或密码。事实上&#xff0c;它们是负责安装在计算机上的代理服务器并且不关心更改默认设置的系统管理员的错误或疏忽。因此&…

道路救援入驻派单小程序开源版开发

道路救援入驻派单小程序开源版开发 1、用户立即救援 2、后台收到救援通知&#xff0c;派单救援师傅. 道路救援入驻派单小程序通常会包含一系列功能&#xff0c;旨在方便救援服务提供商、用户和后台管理系统之间的交互。以下是一个可能的功能列表&#xff1a; 用户端功能&…

GPOPS-II教程(4): 多级火箭上升最优控制问题

文章目录 本篇重点问题描述动力学方程约束条件性能指标 GPOPS代码main function1. 初始参数设置2. 边界条件设置3.初值猜测4.设置GPOPS求解器参数5.求解6.画图 continuous function1. 取输入参数2. 计算过程变量3. 写动力学方程4. 给输出 endpoint function坐标转换函数位置-速…

大猫咪守护LoRA:定制你的大猫私人大猫咪宠物写真合影,某音某书流行款

&#x1f339;大家好&#xff01;我是安琪&#xff01;感谢大家的支持与鼓励。 大猫咪LoRA模型简介 今天应群里同学大猫咪宠物合影写真提议&#xff0c;为大家介绍一款来自作者 沐沐人像合成的主题为大猫咪守护的LoRAl模型&#xff1a;沐沐-大猫咪。这是一款当下在某音、某书…

UniApp中的背景音频播放:深入理解uni.getBackgroundAudioManager()

在移动应用开发中,音频播放是一个常见且重要的功能。UniApp框架提供了强大的背景音频管理器 uni.getBackgroundAudioManager(),让我们能够轻松实现跨平台的音频播放功能。本文将深入探讨如何在UniApp中使用这个API来创建优质的音频播放体验。 1. 背景音频管理器简介 uni.getB…

解决llama-factory运行中的No module named ‘_bz2‘和No module named ‘_lzma‘

问题描述 在llama-factory执行lora微调时&#xff0c;按照手册安装了依赖&#xff0c;微调还是遇到错误 File "/usr/local/python3.10.2/lib/python3.10/site-packages/datasets/utils/extract.py", line 1, in <module>import bz2File "/usr/local/pyt…

基于FreeRTOS+STM32CubeMX+LCD1602+MCP3308(SPI接口)的8通道ADC转换器Proteus仿真

一、仿真原理图: 二、仿真效果: 三、STM32CubeMX配置: 1)、时钟配置: 2)、USART配置: 四、软件部分: 1)、主功能函数: 2)、初始化部分: /* USER CODE BEGIN Header */ /** ******************************************************************************

Apache Flink类型及序列化研读生产应用|得物技术

一、背景 序列化是指将数据从内存中的对象序列化为字节流&#xff0c;以便在网络中传输或持久化存储。序列化在Apache Flink中非常重要&#xff0c;因为它涉及到数据传输和状态管理等关键部分。Apache Flink以其独特的方式来处理数据类型以及序列化&#xff0c;这种方式包括它…

vscode使用Black Formatter以及Flake8实现代码格式化

vscode使用Black Formatter以及Flake8实现代码格式化&#xff08;实现和pycharm相似的效果&#xff09; 简单介绍一下这两个插件的功能&#xff0c;flake8可以实现对python代码风格的检测&#xff0c;对空格换行等内容都会有提示。 Black Formatter则可以实现在保存时&#x…

kafka 消费者 API 使用总结

前言 应用程序使用KafkaConsumer向Kafka订阅主题&#xff0c;并从订阅的主题中接收消息。不同于从其他消息系统读取数据&#xff0c;从Kafka读取数据涉及一些独特的概念和想法。如果不先理解这些概念&#xff0c;则难以理解如何使用消费者API。本文将先解释这些重要的概念&…

【Android面试八股文】如何给ListView RecyclerView加上拉刷新 下拉加载更多机制?

文章目录 一、给 ListView 加上下拉刷新和上拉加载更多的机制1. 下拉刷新(Pull to Refresh)使用 SwipeRefreshLayout 实现下拉刷新:2. 上拉加载更多(Load More on Scroll)实现 ListView 的上拉加载更多:3.注意事项二、给RecyclerView加上拉刷新 & 下拉加载更多机制1.…

【乐吾乐2D可视化组态编辑器】文件

1 文件 文件&#xff1a;文件的新建、打开、导入、保存、另存为、下载JOSN文件、下载ZIP打包文件、导出为HTML、导出为Vue2组件、导出为Vue3组件、导出为React组件&#xff08;老版将不再维护&#xff09;、下载为PNG、下载为SVG 乐吾乐2D可视化组态编辑器demo&#xff1a;ht…

Elasticsearch 聚合查询

Hi~&#xff01;这里是奋斗的小羊&#xff0c;很荣幸您能阅读我的文章&#xff0c;诚请评论指点&#xff0c;欢迎欢迎 ~~ &#x1f4a5;&#x1f4a5;个人主页&#xff1a;奋斗的小羊 &#x1f4a5;&#x1f4a5;所属专栏&#xff1a;C语言 &#x1f680;本系列文章为个人学习…