【公益案例展】华为云X《无尽攀登》——攀登不停,向上而行


7513c5e9487569383b2dc9334f76afc6.png

华为云公益案例

本项目案例由华为云投递并参与数据猿与上海大数据联盟联合推出的 #榜样的力量# 《2024中国数据智能产业最具社会责任感企业》榜单/奖项”评选。

cd6956ac78f44cfaaf7086e546cdd0b2.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


夏伯渝,中国无腿登珠峰第一人,一生43年勇攀5次珠峰,最终在69岁高龄成功登顶。他的事迹也被拍成了纪录片《无尽攀登》,广为流传。华为云盘古媒体大模型的视频翻译能力,将《无尽攀登》译制为英文版,并可以保留原始角色的音色、情感、语气等。除了声音外,通过媒体大模型的口型驱动模型,可以实现音唇同步,带来更好的观看体验。华为云盘古媒体大模型助力中国影视文化出海,将中国精神传递到世界各地!

时间周期:

开始时间:2024年4月

截止时间:2026年4月

服务周期:服务中

应用场景

视频AI翻译能力,应用于影视出海、短剧出海等场景。传统视频译制,需要配音演员熟悉翻译后的台词、体会角色情感,再对视频进行目标语种的重配音,质量便完全取决于配音演员的专业能力,且角色的声音和情感都会被重塑。受限于人工译制成本高,当前译制质量参差不齐,产能也有限。通过华为云媒体大模型提供的视频翻译能力,可以保留原始角色的音色、情感、语气,用AI将视频翻译为目标语言。除中英译制外,华为云联合逻辑智能伙伴的能力,可以实现韩语、法语、德语 西语、泰语、阿语等15种语言的译制,达到影视级译制效果。除了声音外,通过媒体大模型的口型驱动模型,可以实现音唇同步,带来更好的观看体验,尤其在侧面、多人对话、物体遮挡以及人物移动等场景,也能做到很好的口型匹配。

面临挑战

行业挑战:目前,影视/短剧出海需求旺盛。传统视频译制,需要配音演员熟悉翻译后的台词、体会角色情感,再对视频进行目标语种的重配音,质量便完全取决于配音演员的专业能力,且角色的声音和情感都会被重塑,口型也无法对应。受限于人工译制成本高,当前译制质量参差不齐,产能也有限。

项目挑战:《无尽攀登》这部纪录片是院线上映的影片,是影视级效果。且该纪录片全部为现场真实拍摄,全部为现场收音,有大量复杂的场景如爬珠穆朗玛峰过程的暴风、雪崩、各类杂音等问题,导致人声和环境杂音无法分离,且人物台词情感非常丰富、情绪很复杂,想要将这样的原声色原情感保留,并翻译成外文,难度非常大。华为云首次进行影视级影片的AI视频翻译,挑战非常大,时间也非常紧张,既要将原人物声色翻译成外语,且要让AI来还原人物情感。

技术开发过程

在媒体内容生产和应用领域,盘古大模型通过AI原声译制与视频生成能力,实现了将原片译制成不同语言的视频,并保留原始角色的音色、情感和语气。更为重要的是,盘古还能同步生成新的口型,确保不同语言对应的口型一致,使得跨语言沟通更加自然流畅;将译制配音、动漫生成等场景的制作周期从月级缩短到天级,大大提升制作效率,作品一次拍摄多元化制作,实现价值最大化;还能通过AI翻译和拟人化语音合成能力,实现更多的精品中文影视出海,助力中国文化出海

整个视频翻译方案是基于文字模态、语音模态、视频模态等三个模态的AI翻译大模型来实现的。整个处理过程涉及内容采集、说话人分镜、翻译(字幕翻译、语音翻译和口型翻译)、内容合成等四个步骤。整个流程是全自动化Pipeline完成。

如语音模态的翻译,一般影视视频中都包含人声和环境背景效果音,影视内容中会有大量环境音嘈杂的素材,这会使AI音译出来的人声非常小。需要利用AI的分离模型技术,让环境声和人声分开,就不会出现人声过小的情况。此外,基于华为自研的盘古语音大模型将源视频说话人每一句话的情感、音色、语音进行跨语音声音克隆,完成音色和情绪跨语种迁移。

其中最难实现的是视频模态的翻译,视频中不同人物有大量的不同角度说话,人物的脸有的是侧对镜头,要必须确保这样的镜头中他说话的口型和音译后的台词完全对应。口型问题看似最难解决,基于华为自研的盘古媒体大模型的口型模型技术后,可以从视觉层面让人物在影片音译后不论哪个角度口型都完全一致。通俗点讲,也就是将语音模态输出的音频信号和人物口型建立起联系,进一步讲,就是将音素(声音的最小单位)映射到视素(某一音素相对应的嘴、舌头、下颚等可视发音器官所处的物理状态)。根据经验,一种口型可能会表示不同的发音信息,即多个音素对应一个视素,那么就可以把该问题看成是多对一的映射方式。另外不同语种对应有不同的音素单元。人讲话时,口型是连续的动作,可以将人的口型简化为按照上下、左右张开的幅度进行简单划分为几种,即讲连续变量转化为类别变量,极端一点讲,张、微张、闭三种口型就可以构成口型库。大模型深度学习的任务,就可以理解为音素序列到开口大小的映射过程:从音频信号中提取特征,并将对应的口型作为标签,建立起数据集,基于数据集来训练模型。

应用效果/社会价值

纪录片《无尽攀登》原本只有中文版,无外文版。华为云盘古媒体大模型用AI能力将该影片翻译为外文版,并保留原人物的音色、情感等,可以非常好的将夏伯渝永不言弃、勇攀高峰的精神传递到海外,让全世界看到中国人的不屈及向上的精神。

关于企业

.华为云

华为云持续践行“一切皆服务”,为客户、伙伴和开发者提供稳定可靠、安全可信、可持续发展的云服务,做好行业数字化的“云底座”和“使能器”,加速千行万业智能化,成为百花园的“黑土地”。

2023年,华为云持续创新,全球业务保持快速增长。截至目前,华为云已覆盖全球33个地理区域、93个可用区,为170多个国家和地区的客户提供服务;入选8个Gartner魔力象限,新进入AI开发者服务、容器管理和分布式混合基础架构等魔力象限,在超过20个细分领域斩获市场第一。

点击文末左下角“阅读原文”链接还可查看“华为云”官网

以上由华为云投递申报的项目案例,最终将会角逐由数据猿与上海大数据联盟联合推出的 #榜样的力量# 《2024中国数据智能产业最具社会责任感企业》榜单/奖项

该榜单最终将于7月24日北京举办的“2024企业数智化转型升级发展论坛——暨AI大模型趋势论坛”现场首次揭晓榜单,并举行颁奖仪式,欢迎报名莅临现场:

b18e142af6167e610c1a8013a2ba26ce.jpeg

8736e17b6e22efe9c85ec8fb3641465e.png

20d310066f106d3906a7d11d9264e5c6.png

c4882e62234415bb70741427f11c5ef9.jpeg

f2d89898e654a053f1475337ae6a62f6.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/45786.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Guava LocalCache源码分析:LocalCache生成

Guava LocalCache源码分析:Cache生成 版本LocalCache参数说明Cache构建过程LocalCache介绍LocalCache实例化将builder中的属性赋值到LocalCache中分段 LocalCache为guava本地缓存的解决方案,提供了基于容量,时间和引用的缓存回收方式&#xf…

目标检测大揭秘:算法种类与优劣分析

目标检测大揭秘:算法种类与优劣分析🔍 在当今这个信息爆炸的时代,图像识别技术正逐渐成为我们生活中不可或缺的一部分。目标检测作为图像识别领域的重要分支,已经广泛应用于安全监控、自动驾驶、智能家居等多个领域。今天&#x…

算法复杂度<数据结构 C版>

什么是算法复杂度? 简单来说算法复杂度是用来衡量一个算法的优劣的,一个程序在运行时,对运行时间和运行空间有要求,即时间复杂度和空间复杂度。 目录 什么是算法复杂度? 大O的渐近表达式 时间复杂度示例 空间复杂度…

Python向某个网页发起请求

在Python中,向某个网页发起请求最常用的库是requests。该库简单易用,支持HTTP的GET、POST、PUT、DELETE等方法。以下是如何使用requests库向网页发起请求的例子: 首先,你需要确保安装了requests库。如果你还没有安装,…

Jenkins 离线升级

1. 环境说明 环境 A: jenkins 版本:2.253使用 systemctl 管理的 jenkins 服务 环境 B: 可以上网的机器,装有 docker-compose docker 和 docker-compose 安装,这里都略了。 2. 安装旧版本 2.1 环境 A jenkins 目录打包文件 …

2024辽宁省大学数学建模竞赛试题思路

A题 (1) 建立模型分析低空顺风风切变对起飞和降落的影响 模型假设 飞机被视为质点,忽略其尺寸和形状对风阻的影响。风切变仅考虑顺风方向的变化,忽略其他方向的风切变。飞机的飞行速度、高度和姿态(如迎角、俯仰角)是变化的&am…

(补充):java各种进制、原码、反码、补码和文本、图像、音频在计算机中的存储方式

文章目录 前言一、进制1 逢几进一2 常见进制在java中的表示3 进制中的转换(1)任意进制转十进制(2)十进制转其他进制二、计算机中的存储1 计算机的存储规则(文本数据)(1)ASCII码表(2)编码规则的发展演化2 计算机的存储规则(图片数据)(1)分辨率、像素(2)黑白图与灰度…

服务器操作集合

服务器使用PC作为代理访问外网 1、PC上启动代理,比如nginx 下载nginx:http://nginx.org/en/download.html 修改配置文件,在conf下: http {include mime.types;default_type application/octet-stream;sendfile o…

深入理解二叉树遍历:递归与迭代实现

介绍 在数据结构中,二叉树是一种重要且常见的数据结构,它的遍历方式包括先序、中序和后序三种。本文将通过Java语言,详细讲解如何实现这三种遍历方式的递归和迭代版本。 二叉树定义 首先,我们定义二叉树的节点类 TreeNode&…

罗技K380无线键盘及鼠标:智慧互联,一触即通

目录 1. 背景2. K380无线键盘连接电脑2.1 键盘准备工作2.2 电脑配置键盘的连接 3. 无线鼠标的连接3.1 鼠标准备工作3.2 电脑配置鼠标的连接 1. 背景 有一阵子经常使用 ipad,但是对于我这个习惯于键盘打字的人来说,慢慢在 ipad 上打字,实在是…

面试真题 | ARM体系架构基础知识

ARM体系架构基础知识 什么是ARM架构?它有哪些特点和优势? 参考答案 ARM架构(Advanced RISC Machine)是一种处理器架构,广泛应用于移动设备、嵌入式系统和低功耗应用中。以下是ARM架构的一些特点和优势: 简化指令集:ARM采用精简指令集(RISC, Reduced Instruction Set Co…

cv::Mat 操作多维矩阵的思路

现在有一个 [20(rows) * 20(cols) * 144(channels)]的矩阵&#xff0c;我们想截取一个[20 * 20 * 80]的子矩阵&#xff1a; int dims[3] {20, 20, 144}; cv::Mat mat(cv::Size(dims[1], dims[0]), CV_32FC(dims[2]), (void*)input); const std::vector<cv::Range>&…

conda install问题记录

最近想用代码处理sar数据&#xff0c;解放双手。 看重了isce这个处理平台&#xff0c;在安装包的时候遇到了一些问题。 这一步持续了非常久&#xff0c;然后我就果断ctrlc了 后面再次进行尝试&#xff0c;出现一大串报错&#xff0c;不知道是不是依赖项的问题 后面看到说mam…

模块化(一)nodejs

模块化 一.模块化的基本概念1.1 什么是模块化1.2 模块化规范 二.Node.js 中的模块化2.1 Node.js 中模块的分类2.2 加载模块2.3 Node.js 中的模块作用域2.4 向外共享模块作用域中的成员 一.模块化的基本概念 1.1 什么是模块化 模块化 是指解决一个 复杂问题 时&#xff0c;自顶…

从Centos7升级到Rocky linux 9后,网卡连接显示‘Wired connection 1‘问题解决方法

问题描述 从Centos7升级到Rocky9后, 发现网卡eth0的IP不正确。通过nmcli查看网卡连接&#xff0c;找不到name为eth0的连接&#xff0c;只显示’Wired connection 1’ 查看/etc/NetworkManager/system-connections/&#xff0c;发现找不到网卡配置文件。 原因分析 centos7使…

华为OD机试 - 堆内存申请(Java 2024 D卷 100分)

华为OD机试 2024D卷题库疯狂收录中&#xff0c;刷题点这里 专栏导读 本专栏收录于《华为OD机试&#xff08;JAVA&#xff09;真题&#xff08;D卷C卷A卷B卷&#xff09;》。 刷的越多&#xff0c;抽中的概率越大&#xff0c;每一题都有详细的答题思路、详细的代码注释、样例测…

Hadoop-28 ZooKeeper集群 ZNode简介概念和测试 数据结构与监听机制 持久性节点 持久顺序节点 事务ID Watcher机制

章节内容 上节我们完成了&#xff1a; ZooKeeper 集群配置ZooKeeper 集群启动ZooKeeper 集群状况查看Follower 和 Leader 节点 背景介绍 这里是三台公网云服务器&#xff0c;每台 2C4G&#xff0c;搭建一个Hadoop的学习环境&#xff0c;供我学习。 之前已经在 VM 虚拟机上搭…

基于SpringBoot+Vue的数码论坛系统(带1w+文档)

基于SpringBootVue的数码论坛系统(带1w文档) 基于SpringBootVue的数码论坛系统(带1w文档) 数码论坛系统能够通过互联网得到广泛的、全面的宣传&#xff0c;让尽可能多的用户了解和熟知数码论坛系统的便捷高效&#xff0c;不仅为用户提供了服务&#xff0c;而且也推广了自己&…

【pytorch】手写数字识别

https://blog.csdn.net/qq_45588019/article/details/120935828 基本均参考该博客 《深度学习原理Pytorch实战》 初步处理 导包 import torch import numpy as np from matplotlib import pyplot as plt from torch.utils.data import DataLoader from torchvision import tr…

python pandas处理股票量化数据:笔记3

获取tushare日线数据 示例 pro ts.pro_api()df pro.daily(ts_code000001.SZ, start_date20180701, end_date20180718)#多个股票 df pro.daily(ts_code000001.SZ,600000.SH, start_date20180701, end_date20180718) 或者 df pro.query(daily, ts_code000001.SZ, start_da…