【公益案例展】华为云X《无尽攀登》——攀登不停,向上而行


7513c5e9487569383b2dc9334f76afc6.png

华为云公益案例

本项目案例由华为云投递并参与数据猿与上海大数据联盟联合推出的 #榜样的力量# 《2024中国数据智能产业最具社会责任感企业》榜单/奖项”评选。

cd6956ac78f44cfaaf7086e546cdd0b2.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


夏伯渝,中国无腿登珠峰第一人,一生43年勇攀5次珠峰,最终在69岁高龄成功登顶。他的事迹也被拍成了纪录片《无尽攀登》,广为流传。华为云盘古媒体大模型的视频翻译能力,将《无尽攀登》译制为英文版,并可以保留原始角色的音色、情感、语气等。除了声音外,通过媒体大模型的口型驱动模型,可以实现音唇同步,带来更好的观看体验。华为云盘古媒体大模型助力中国影视文化出海,将中国精神传递到世界各地!

时间周期:

开始时间:2024年4月

截止时间:2026年4月

服务周期:服务中

应用场景

视频AI翻译能力,应用于影视出海、短剧出海等场景。传统视频译制,需要配音演员熟悉翻译后的台词、体会角色情感,再对视频进行目标语种的重配音,质量便完全取决于配音演员的专业能力,且角色的声音和情感都会被重塑。受限于人工译制成本高,当前译制质量参差不齐,产能也有限。通过华为云媒体大模型提供的视频翻译能力,可以保留原始角色的音色、情感、语气,用AI将视频翻译为目标语言。除中英译制外,华为云联合逻辑智能伙伴的能力,可以实现韩语、法语、德语 西语、泰语、阿语等15种语言的译制,达到影视级译制效果。除了声音外,通过媒体大模型的口型驱动模型,可以实现音唇同步,带来更好的观看体验,尤其在侧面、多人对话、物体遮挡以及人物移动等场景,也能做到很好的口型匹配。

面临挑战

行业挑战:目前,影视/短剧出海需求旺盛。传统视频译制,需要配音演员熟悉翻译后的台词、体会角色情感,再对视频进行目标语种的重配音,质量便完全取决于配音演员的专业能力,且角色的声音和情感都会被重塑,口型也无法对应。受限于人工译制成本高,当前译制质量参差不齐,产能也有限。

项目挑战:《无尽攀登》这部纪录片是院线上映的影片,是影视级效果。且该纪录片全部为现场真实拍摄,全部为现场收音,有大量复杂的场景如爬珠穆朗玛峰过程的暴风、雪崩、各类杂音等问题,导致人声和环境杂音无法分离,且人物台词情感非常丰富、情绪很复杂,想要将这样的原声色原情感保留,并翻译成外文,难度非常大。华为云首次进行影视级影片的AI视频翻译,挑战非常大,时间也非常紧张,既要将原人物声色翻译成外语,且要让AI来还原人物情感。

技术开发过程

在媒体内容生产和应用领域,盘古大模型通过AI原声译制与视频生成能力,实现了将原片译制成不同语言的视频,并保留原始角色的音色、情感和语气。更为重要的是,盘古还能同步生成新的口型,确保不同语言对应的口型一致,使得跨语言沟通更加自然流畅;将译制配音、动漫生成等场景的制作周期从月级缩短到天级,大大提升制作效率,作品一次拍摄多元化制作,实现价值最大化;还能通过AI翻译和拟人化语音合成能力,实现更多的精品中文影视出海,助力中国文化出海

整个视频翻译方案是基于文字模态、语音模态、视频模态等三个模态的AI翻译大模型来实现的。整个处理过程涉及内容采集、说话人分镜、翻译(字幕翻译、语音翻译和口型翻译)、内容合成等四个步骤。整个流程是全自动化Pipeline完成。

如语音模态的翻译,一般影视视频中都包含人声和环境背景效果音,影视内容中会有大量环境音嘈杂的素材,这会使AI音译出来的人声非常小。需要利用AI的分离模型技术,让环境声和人声分开,就不会出现人声过小的情况。此外,基于华为自研的盘古语音大模型将源视频说话人每一句话的情感、音色、语音进行跨语音声音克隆,完成音色和情绪跨语种迁移。

其中最难实现的是视频模态的翻译,视频中不同人物有大量的不同角度说话,人物的脸有的是侧对镜头,要必须确保这样的镜头中他说话的口型和音译后的台词完全对应。口型问题看似最难解决,基于华为自研的盘古媒体大模型的口型模型技术后,可以从视觉层面让人物在影片音译后不论哪个角度口型都完全一致。通俗点讲,也就是将语音模态输出的音频信号和人物口型建立起联系,进一步讲,就是将音素(声音的最小单位)映射到视素(某一音素相对应的嘴、舌头、下颚等可视发音器官所处的物理状态)。根据经验,一种口型可能会表示不同的发音信息,即多个音素对应一个视素,那么就可以把该问题看成是多对一的映射方式。另外不同语种对应有不同的音素单元。人讲话时,口型是连续的动作,可以将人的口型简化为按照上下、左右张开的幅度进行简单划分为几种,即讲连续变量转化为类别变量,极端一点讲,张、微张、闭三种口型就可以构成口型库。大模型深度学习的任务,就可以理解为音素序列到开口大小的映射过程:从音频信号中提取特征,并将对应的口型作为标签,建立起数据集,基于数据集来训练模型。

应用效果/社会价值

纪录片《无尽攀登》原本只有中文版,无外文版。华为云盘古媒体大模型用AI能力将该影片翻译为外文版,并保留原人物的音色、情感等,可以非常好的将夏伯渝永不言弃、勇攀高峰的精神传递到海外,让全世界看到中国人的不屈及向上的精神。

关于企业

.华为云

华为云持续践行“一切皆服务”,为客户、伙伴和开发者提供稳定可靠、安全可信、可持续发展的云服务,做好行业数字化的“云底座”和“使能器”,加速千行万业智能化,成为百花园的“黑土地”。

2023年,华为云持续创新,全球业务保持快速增长。截至目前,华为云已覆盖全球33个地理区域、93个可用区,为170多个国家和地区的客户提供服务;入选8个Gartner魔力象限,新进入AI开发者服务、容器管理和分布式混合基础架构等魔力象限,在超过20个细分领域斩获市场第一。

点击文末左下角“阅读原文”链接还可查看“华为云”官网

以上由华为云投递申报的项目案例,最终将会角逐由数据猿与上海大数据联盟联合推出的 #榜样的力量# 《2024中国数据智能产业最具社会责任感企业》榜单/奖项

该榜单最终将于7月24日北京举办的“2024企业数智化转型升级发展论坛——暨AI大模型趋势论坛”现场首次揭晓榜单,并举行颁奖仪式,欢迎报名莅临现场:

b18e142af6167e610c1a8013a2ba26ce.jpeg

8736e17b6e22efe9c85ec8fb3641465e.png

20d310066f106d3906a7d11d9264e5c6.png

c4882e62234415bb70741427f11c5ef9.jpeg

f2d89898e654a053f1475337ae6a62f6.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/45786.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Guava LocalCache源码分析:LocalCache生成

Guava LocalCache源码分析:Cache生成 版本LocalCache参数说明Cache构建过程LocalCache介绍LocalCache实例化将builder中的属性赋值到LocalCache中分段 LocalCache为guava本地缓存的解决方案,提供了基于容量,时间和引用的缓存回收方式&#xf…

算法复杂度<数据结构 C版>

什么是算法复杂度? 简单来说算法复杂度是用来衡量一个算法的优劣的,一个程序在运行时,对运行时间和运行空间有要求,即时间复杂度和空间复杂度。 目录 什么是算法复杂度? 大O的渐近表达式 时间复杂度示例 空间复杂度…

Jenkins 离线升级

1. 环境说明 环境 A: jenkins 版本:2.253使用 systemctl 管理的 jenkins 服务 环境 B: 可以上网的机器,装有 docker-compose docker 和 docker-compose 安装,这里都略了。 2. 安装旧版本 2.1 环境 A jenkins 目录打包文件 …

2024辽宁省大学数学建模竞赛试题思路

A题 (1) 建立模型分析低空顺风风切变对起飞和降落的影响 模型假设 飞机被视为质点,忽略其尺寸和形状对风阻的影响。风切变仅考虑顺风方向的变化,忽略其他方向的风切变。飞机的飞行速度、高度和姿态(如迎角、俯仰角)是变化的&am…

(补充):java各种进制、原码、反码、补码和文本、图像、音频在计算机中的存储方式

文章目录 前言一、进制1 逢几进一2 常见进制在java中的表示3 进制中的转换(1)任意进制转十进制(2)十进制转其他进制二、计算机中的存储1 计算机的存储规则(文本数据)(1)ASCII码表(2)编码规则的发展演化2 计算机的存储规则(图片数据)(1)分辨率、像素(2)黑白图与灰度…

服务器操作集合

服务器使用PC作为代理访问外网 1、PC上启动代理,比如nginx 下载nginx:http://nginx.org/en/download.html 修改配置文件,在conf下: http {include mime.types;default_type application/octet-stream;sendfile o…

罗技K380无线键盘及鼠标:智慧互联,一触即通

目录 1. 背景2. K380无线键盘连接电脑2.1 键盘准备工作2.2 电脑配置键盘的连接 3. 无线鼠标的连接3.1 鼠标准备工作3.2 电脑配置鼠标的连接 1. 背景 有一阵子经常使用 ipad,但是对于我这个习惯于键盘打字的人来说,慢慢在 ipad 上打字,实在是…

conda install问题记录

最近想用代码处理sar数据,解放双手。 看重了isce这个处理平台,在安装包的时候遇到了一些问题。 这一步持续了非常久,然后我就果断ctrlc了 后面再次进行尝试,出现一大串报错,不知道是不是依赖项的问题 后面看到说mam…

模块化(一)nodejs

模块化 一.模块化的基本概念1.1 什么是模块化1.2 模块化规范 二.Node.js 中的模块化2.1 Node.js 中模块的分类2.2 加载模块2.3 Node.js 中的模块作用域2.4 向外共享模块作用域中的成员 一.模块化的基本概念 1.1 什么是模块化 模块化 是指解决一个 复杂问题 时,自顶…

从Centos7升级到Rocky linux 9后,网卡连接显示‘Wired connection 1‘问题解决方法

问题描述 从Centos7升级到Rocky9后, 发现网卡eth0的IP不正确。通过nmcli查看网卡连接,找不到name为eth0的连接,只显示’Wired connection 1’ 查看/etc/NetworkManager/system-connections/,发现找不到网卡配置文件。 原因分析 centos7使…

华为OD机试 - 堆内存申请(Java 2024 D卷 100分)

华为OD机试 2024D卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试(JAVA)真题(D卷C卷A卷B卷)》。 刷的越多,抽中的概率越大,每一题都有详细的答题思路、详细的代码注释、样例测…

Hadoop-28 ZooKeeper集群 ZNode简介概念和测试 数据结构与监听机制 持久性节点 持久顺序节点 事务ID Watcher机制

章节内容 上节我们完成了: ZooKeeper 集群配置ZooKeeper 集群启动ZooKeeper 集群状况查看Follower 和 Leader 节点 背景介绍 这里是三台公网云服务器,每台 2C4G,搭建一个Hadoop的学习环境,供我学习。 之前已经在 VM 虚拟机上搭…

基于SpringBoot+Vue的数码论坛系统(带1w+文档)

基于SpringBootVue的数码论坛系统(带1w文档) 基于SpringBootVue的数码论坛系统(带1w文档) 数码论坛系统能够通过互联网得到广泛的、全面的宣传,让尽可能多的用户了解和熟知数码论坛系统的便捷高效,不仅为用户提供了服务,而且也推广了自己&…

【pytorch】手写数字识别

https://blog.csdn.net/qq_45588019/article/details/120935828 基本均参考该博客 《深度学习原理Pytorch实战》 初步处理 导包 import torch import numpy as np from matplotlib import pyplot as plt from torch.utils.data import DataLoader from torchvision import tr…

Cypress UI自动化之安装环境

注:macOS系统 一、git环境 略 二、node环境 1、安装nvm 前提:有装过Homebrew,参考adb使用方法文档 1、安装nvm:首先要保证之前没有安装过node,如果之前安装过,先 brew uninstall node brew install n…

计算云服务4

第四章 弹性伸缩服务 什么是弹性伸缩(AS) 弹性伸缩(Auto Scaling,AS)是根据用户的业务需求,通过策略自动调整其业务资源的服务。用户可以根据业务需求自行定义伸缩配置和伸缩策略,降低人为反复调整资源以应对业务变化和高峰压力的工作量&am…

C语言 | Leetcode C语言题解之第231题2的幂

题目&#xff1a; 题解&#xff1a; const int BIG 1 << 30;bool isPowerOfTwo(int n) {return n > 0 && BIG % n 0; }

为什么远程办公不被公司普遍接受?

为什么远程办公不被公司普遍接受? 如果说传统企业不接受远程公办,那么为什么互联网企业也不接受远程办公呢? VPN 虚拟专用网络(Virtual Private Network) VPN 是远程办公的基石,没有VPN远程办公处处受限。什么是VPN呢? 它能实现跨地域,不受地域限制地把办公室网络和个…

暑期备考美国数学竞赛AMC8和AMC10:吃透1850道真题和知识点

距离接下来的AMC8、AMC10美国数学竞赛还有几个月的时间&#xff0c;实践证明&#xff0c;做真题&#xff0c;吃透真题和背后的知识点是备考AMC8、AMC10有效的方法之一。 通过做真题&#xff0c;可以帮助孩子找到真实竞赛的感觉&#xff0c;而且更加贴近比赛的内容&#xff0c;…

全面升级的对象创建——抽象工厂模式(Python实现和JAVA实现)

1. 引言 大家好&#xff01;在之前的文章中&#xff0c;我们探讨了简单工厂和工厂方法模式&#xff1a; 轻松创建对象——简单工厂模式&#xff08;Python实现&#xff09; 轻松创建对象——简单工厂模式&#xff08;Java实现&#xff09; 灵活多变的对象创建——工厂方法模式…