3D数字人视频合成用户指南

数字人开放平台3D互动数字人如何接入_虚拟数字人(DVH)-阿里云帮助中心3D互动数字人(对应开放平台的“智能客服”场景)是虚拟数字人开放平台提供能够支持用户与3D数字人进行实时语音交互的数字人产品能力,需要配合智能对话机器人产品使用。本篇文档将介绍如何接入3D互动数字人。icon-default.png?t=N7T8https://help.aliyun.com/zh/avatar/avatar/developer-reference/integrate-3d-interactive-dvh

1 进入视频合成页面

进入数字人开放平台控制台,点击视频合成-新建视频,选择3D形象进入视频合成页面。

image.png

image.png

2 视频设置

2.1 数字人

点击数字人,可在此重新选择数字人形象。

image

鼠标悬浮在某一形象上方,显示【形象配置】按钮,此时点击将前往资产中心-3D数字人资产,可在此页面对数字人形象进行配置,如发型、妆容、服装、声音等。

2.2 声音

点击声音,可选择数字人播报的音色并调整音色对应的音量、语速和音调,目前平台提供四个类别的音色:男声、女声、童声以及方言;多情感音色支持在文本编辑器中针对文本进行情绪化的编辑,详见3.1节语音编辑;带星号的音色为使用频率较高的音色。

image

2.3 背景图

点击背景图,可选择平台内置的背景,包括透明背景;同时可上传自定义背景,上传时请注意背景图大小要求。

image

2.4 字幕

点击字幕,根据需要打开或者关闭字幕开关,可调整字幕样式,如字体、字号、字体颜色、描边颜色。

image

2.5 尺寸

在预览画面上方,可选择尺寸,目前平台支持两种尺寸:16:9、9:16。

2.6 调整数字人在画面中的大小以及位置

在左侧的预览画面中,通过鼠标拖拽数字人,可移动数字人,调整其在画面中位置;另外平台提供了远景、近景和特写三种景别以及正面、左侧30°和右侧30°三种机位,用户可在预览画面中看到相应的效果并选择适合的组合。

image.png

image

image

3 播报内容输入

3.1 文本输入

选择文本输入,您可在文本框中输入希望数字人播报的文本来制作视频。

3.1.1 语音合成的编辑功能
  1. 文本输入框集成了语音合成的编辑器功能,可在该编辑器中对语音合成进行人工的调整,例如标注多音字、标注文本读法、标注数值读法等,详见下表。

  2. 同时文本输入框集成了情绪化音色的编辑能力,可在编辑器中选中某段文本并选择需要的情绪,详见下表。注意:该功能需要在声音设置中选择多情感音色。

功能

子功能

备注

操作方法

多音

/

/

弹出浮层高亮多音字,逐一标注

文本

人名

姓氏自动匹配、连续

划选文字后选择读法

地址

示例:2单元301读作二单元三零幺

标点符号

读标点本身发音

ID

读字母和数值

日期

示例:2019/10/21读作二零一九年十月二十一日

时间

示例:01:13:43读作一点十三分四十三秒

计量单位

示例:mm读作毫秒(在阿里云语音合成服务中会将mm读作毫秒)

数值

读数值

示例:123读作一百二十三

划选数字文本后选择读法

读数字

示例:123读作一二三

读手机号

示例:13900001111

读作幺三九<停顿0.5s>零零零零<停顿0.5s>幺幺幺幺

英文

读字母

每个字母分开发音

划选英文文本后选择读法

连续

/

选中的文本连续发音

划选需要调整的文本

停顿

0.5s

停顿0.5s

在光标位置插入停顿

1s

停顿1s

2s

停顿2s

情绪

生气

/

划选文字后选择情绪,默认为自然情绪

害怕

开心

厌恶

悲伤

惊讶

插入日期

/

/

在光标位置插入当前日期

插入时间

/

/

在光标位置插入当前时间

试听

/

/

划选需要试听的文本进行试听(需完成声音设置)

3.1.2 动作编辑

文本输入框也集成了动作编辑的功能,可在文本中插入数字人动作。目前支持两种形式的插入:(1)自定义动作,用户可以选择该数字人的动作进行自主插入。在自定义动作时,也可以点击"推荐插入",此时系统将会自动将推荐的动作插入文本中,用户可以在此基础上再次对动作进行修改;(2)智能动作,点击后不会在编辑器中显示动作标签,算法将会根据语义,在合成过程中匹配合适的动作。

image.png

3.2 音频输入

选择音频输入,您可上传本地的音频文件,为保证效果,请上传在安静环境下录制的播报人声。此时生成视频中的声音即为上传的音频。

4 生成视频

4.1 生成视频

点击生成视频,将根据输入的文本生成数字人播报的视频;视频生成时间根据输入的文本长度而定。生成好的视频会在视频管理中展示,可在该页面下进行视频的下载;平台支持生成MOV和MP4格式的视频,其中选择透明背景,生成的MOV视频可以直接在第三方剪辑软件中二次加工;而选择MP4格式将同时导出两个视频,一个为带黑灰色背景的视频,另一个为alpha通道视频,可在专业剪辑软件中通过遮罩功能去除原视频中的背景以获得透明背景的效果。需要注意的是,不管背景是否透明,选择生成MOV格式将会需要较长的渲染时间,且生成的视频也会较大。

4.2 存为草稿

点击存为草稿可将目前的设置和输入的文本存为草稿,草稿将在视频管理中展示,可以继续进入原草稿进行编辑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/35066.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

徐徐拉开的帷幕:拜登与特朗普的辩论大戏 日元跌破160大关!创1986年以来最低纪录

北京时间6月27日&#xff08;本周五&#xff09;上午9:00&#xff0c;拜登和特朗普将参加2024年总统候选人电视辩论。作为参考&#xff0c;2016年大选辩论期间&#xff0c;美元汇率对辩论结果的反应相对温和&#xff0c;希拉里胜选预期增强在一定程度上支撑了美元。 时间逐渐临…

Java - 程序员面试笔记记录 实现 - Part1

社招又来学习 Java 啦&#xff0c;这次选了何昊老师的程序员面试笔记作为主要资料&#xff0c;记录一下一些学习过程。 1.1 Java 程序初始化 Java 程序初始化遵循规则&#xff1a;静态变量优于动态变量&#xff1b;父类优于子类&#xff1b;成员变量的定义顺序&#xff1b; …

Spring的jar包下载(最新版6.0版本)

1.在Spring官网的projects下面点击spring-framework 2.进入github官网 3.进入github后往下滑&#xff0c;点击Spring Framework Artifacts 4.往下滑找到 点击 5.在左边先点击Artifacts&#xff0c;在右边找到 libs-snapshot&#xff0c;展开libs-snapshot&#xff08;之前其他…

道路救援入驻派单小程序开源版开发

道路救援入驻派单小程序开源版开发 1、用户立即救援 2、后台收到救援通知&#xff0c;派单救援师傅. 道路救援入驻派单小程序通常会包含一系列功能&#xff0c;旨在方便救援服务提供商、用户和后台管理系统之间的交互。以下是一个可能的功能列表&#xff1a; 用户端功能&…

GPOPS-II教程(4): 多级火箭上升最优控制问题

文章目录 本篇重点问题描述动力学方程约束条件性能指标 GPOPS代码main function1. 初始参数设置2. 边界条件设置3.初值猜测4.设置GPOPS求解器参数5.求解6.画图 continuous function1. 取输入参数2. 计算过程变量3. 写动力学方程4. 给输出 endpoint function坐标转换函数位置-速…

大猫咪守护LoRA:定制你的大猫私人大猫咪宠物写真合影,某音某书流行款

&#x1f339;大家好&#xff01;我是安琪&#xff01;感谢大家的支持与鼓励。 大猫咪LoRA模型简介 今天应群里同学大猫咪宠物合影写真提议&#xff0c;为大家介绍一款来自作者 沐沐人像合成的主题为大猫咪守护的LoRAl模型&#xff1a;沐沐-大猫咪。这是一款当下在某音、某书…

基于FreeRTOS+STM32CubeMX+LCD1602+MCP3308(SPI接口)的8通道ADC转换器Proteus仿真

一、仿真原理图: 二、仿真效果: 三、STM32CubeMX配置: 1)、时钟配置: 2)、USART配置: 四、软件部分: 1)、主功能函数: 2)、初始化部分: /* USER CODE BEGIN Header */ /** ******************************************************************************

Apache Flink类型及序列化研读生产应用|得物技术

一、背景 序列化是指将数据从内存中的对象序列化为字节流&#xff0c;以便在网络中传输或持久化存储。序列化在Apache Flink中非常重要&#xff0c;因为它涉及到数据传输和状态管理等关键部分。Apache Flink以其独特的方式来处理数据类型以及序列化&#xff0c;这种方式包括它…

vscode使用Black Formatter以及Flake8实现代码格式化

vscode使用Black Formatter以及Flake8实现代码格式化&#xff08;实现和pycharm相似的效果&#xff09; 简单介绍一下这两个插件的功能&#xff0c;flake8可以实现对python代码风格的检测&#xff0c;对空格换行等内容都会有提示。 Black Formatter则可以实现在保存时&#x…

kafka 消费者 API 使用总结

前言 应用程序使用KafkaConsumer向Kafka订阅主题&#xff0c;并从订阅的主题中接收消息。不同于从其他消息系统读取数据&#xff0c;从Kafka读取数据涉及一些独特的概念和想法。如果不先理解这些概念&#xff0c;则难以理解如何使用消费者API。本文将先解释这些重要的概念&…

【乐吾乐2D可视化组态编辑器】文件

1 文件 文件&#xff1a;文件的新建、打开、导入、保存、另存为、下载JOSN文件、下载ZIP打包文件、导出为HTML、导出为Vue2组件、导出为Vue3组件、导出为React组件&#xff08;老版将不再维护&#xff09;、下载为PNG、下载为SVG 乐吾乐2D可视化组态编辑器demo&#xff1a;ht…

Elasticsearch 聚合查询

Hi~&#xff01;这里是奋斗的小羊&#xff0c;很荣幸您能阅读我的文章&#xff0c;诚请评论指点&#xff0c;欢迎欢迎 ~~ &#x1f4a5;&#x1f4a5;个人主页&#xff1a;奋斗的小羊 &#x1f4a5;&#x1f4a5;所属专栏&#xff1a;C语言 &#x1f680;本系列文章为个人学习…

一、安装VMware16

本篇来源&#xff1a;山海同行 本篇地址&#xff1a;https://shanhaigo.cn/courseDetail/1805875642621952000 本篇资源&#xff1a;以整理到-山海同行 一、VMware虚拟机下载 1. 官网下载 1. 打开官网 打开VMware官网地址&#xff1a;https://www.vmware.com/ 2. 选择下载产…

【研究】两千亿高碳投资:头部资管气候行动观察

在气候语境中&#xff0c;“棕”与“绿”是一组对立色&#xff0c;前者被用来描述与低碳理念不符的行动。近日资管机构的“含棕量”受到了气候倡议者的检视。 正文 国际环保机构绿色和平在与海南成美慈善基金会联合发布《中国资产管理机构气候表现研究报告》&#xff08;以下简…

Pytorch实战(一):LeNet神经网络

文章目录 一、模型实现1.1数据集的下载1.2加载数据集1.3模型训练1.4模型预测 LeNet神经网络是第一个卷积神经网络&#xff08;CNN&#xff09;&#xff0c;首次采用了卷积层、池化层这两个全新的神经网络组件&#xff0c;接收灰度图像&#xff0c;并输出其中包含的手写数字&…

告别模糊时代,扫描全能王带来清晰世界

模糊碑文引发的思考 上个月中旬去洛阳拜访了著名的龙门石窟&#xff0c;本就对碑文和文字图画感兴趣的我们&#xff0c;准备好好欣赏一下龙门石窟的历史文化古迹。到了地方之后&#xff0c;我发现石窟的高度和宽度远远超出了想象&#xff0c;正因如此&#xff0c;拍出来的文字…

NewspaceGPT带你玩系列之美人鱼图表

这里写目录标题 注册一个账号&#xff0c;用qq邮箱&#xff0c;然后登录选一个可用的Plus&#xff0c;不要选3.5探索GPT今天的主角是开始寻梦美人鱼图表我选第一个试一下问&#xff1a;重新回答上面的问题&#xff0c;一切都用汉语重新生成一个流程图&#xff1a;生成一个网站登…

OpenAI“跌倒”,国产大模型“吃饱”?

大数据产业创新服务媒体 ——聚焦数据 改变商业 在AI的世界里&#xff0c;OpenAI就像是一位高高在上的霸主&#xff0c;它的一举一动&#xff0c;都能引发行业里的地震。然而&#xff0c;就在不久前&#xff0c;这位霸主突然宣布了一个决定&#xff0c;自7月9日起&#xff0c;…

2024热门骨传导蓝牙耳机怎么选?超全的选购攻略附带好物推荐!

对于很多喜欢运动健身的小伙伴&#xff0c;在现在市面上这么多种类耳机的选择上&#xff0c;对于我来说的话还是很推荐大家去选择骨传导运动耳机的&#xff0c;相较于普通的入耳式蓝牙耳机&#xff0c;骨传导耳机是通过振动来传输声音的&#xff0c;而入耳式耳机则是通过空气传…

以Bert训练为例,测试torch不同的运行方式,并用torch.profile+HolisticTraceAnalysis分析性能瓶颈

以Bert训练为例,测试torch不同的运行方式,并用torch.profileHolisticTraceAnalysis分析性能瓶颈 1.参考链接:2.性能对比3.相关依赖或命令4.测试代码5.HolisticTraceAnalysis代码6.可视化A.优化前B.优化后 以Bert训练为例,测试torch不同的运行方式,并用torch.profileHolisticTra…