Azure语音合成再添新声音,“风格迁移”技术为不同音色实现多情感演绎

微软Azure Neural TTS(神经网络版文本转语音)新增五种声音模型,让我们再次体会到了“风格迁移”技术对AI语音模型多情感多风格的强大支持。

此次更新的五个美式英语声音模型,包括青春甜美的Jane、低沉温和的Nancy、随性且精力充沛的Davis、响亮激昂的Jason和沙哑粗犷的Tony。在“风格迁移”技术的支持下,不仅拥有开心(cheerful)、伤心(sad)、生气(angry)、兴奋(excited)、期待(hopeful)、友好(friendly)、不友好(unfriendly)和恐惧(terrified)等丰富的情感表现,还拥有首次运用的呼喊(shouting)和耳语(whispering)两种表达方式。至此,用户拥有可选择的美式英语声音模型已达到20个,丰富的情感和风格让应用场景更加多元。

现在就来听听这5个新声音吧

声音

性别

示例

Jane

女性

Audio

Davis

男性

Audio

Jason

男性

Audio

Nancy

女性

Audio

Tony

男性

Audio

点击声音模型,感受AI声音的两种新表达方式

声音风格或情感

示例(男性)

示例(女性)

呼喊(shouting)

Audio

Audio

耳语(whispering)

Audio

Audio

点击声音模型示例,感受合成语音蕴含的情感

情感或表达方式

示例(男性)

示例(女性)

开心(cheerful)

Audio

Audio

期待(hopeful)

Audio

Audio

友好(friendly)

Audio

Audio

不友好(unfriendly)

Audio

Audio

恐惧(terrified)

Audio

Audio

 

“风格迁移”技术的原理是把一个声音模型的韵律和语调复制到另一个声音模型上,从而让后者在本身音色不变的前提下,也可以拥有前者说话的韵律和语调。过去,声音风格的搭建主要依靠录音演员录制各种风格的声音数据,再使用录音数据来生成多风格的智能语音模型,但是一名录音演员难以演绎所有风格的声音。风格迁移技术创新地解决了这一问题,可以高效地赋予多AI声音情感和风格。

声音风格和声音情感模型的持续更新,让Azure Neural TTS的合成语音在多种业务场景中得到了广泛应用,让用户感受到了更逼真的语音体验。例如,游戏平台可以快速为角色生成多种情感声音,为游戏增添更多符合情节的个性化表达,让虚拟游戏世界栩栩如生。“State of Decay”(腐烂国度)的创作者——微软亡灵工作室 (Undead Labs) 的使命是为游戏开创崭新的方向,他们在游戏开发中就应用了Azure Neural TTS。推出过包括“Psychonauts 2”(精神病患者2)在内的多款游戏的Double Fine工作室,也正在利用Azure Neural TTS制作未来游戏项目的原型。音频解决方案提供商Remixd在其平台中集成了Azure Neural TTS的声音模型Jenny和Davis,让其客户在创建音频内容时有了更多选择。

关于Azure Neural TTS

微软Azure Neural TTS是Azure认知服务中强大的语音合成功能,能够让开发人员使用AI技术将文本转换为逼真的声音。截止目前,微软Azure Neural TTS支持全球140个国家和地区的语言,提供400个声音模型,可加速声音的自动化生产,帮助各种企业更快地训练出满足业务场景的声音,打造出专属的声音品牌——无论是呼叫中心、语音助手、有声书制作、聊天机器人、语音导购,还是影视剧/动漫配音、自媒体短视频、情感电台、教育培训等场景。

持续的技术迭代和版本更新,让Azure Neural TTS 可以为更多企业、更多场景提供逼真、自然、接地气的声音体验。同时,微软的所有技术进步都接受微软负责任的 AI流程的指导,遵循公平、包容、可靠性与安全性、透明、隐私与保障、负责的原则,并通过微软内部的负责任人工智能办公室 (ORA),人工智能、伦理与工程研究委员会 (Aether),以及负责任AI战略管理团队 (RAISE) 来监督、实施这些道德标准。

现在就来Azure认知服务官网体验极具特色的文本转语音服务,或定制你的专属声音吧。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/511194.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于 Observable 构建前端防腐策略

简介:To B 业务的生命周期与迭代通常会持续多年,随着产品的迭代与演进,以接口调用为核心的前后端关系会变得非常复杂。在多年迭代后,接口的任何一处修改都可能给产品带来难以预计的问题。在这种情况下,构建更稳健的前端…

动态卡片:富媒体内容井喷式增长下,新一代移动端动态研发的模式

简介:「蚂蚁动态卡片」新品发布会全程回顾 在 iOS 和 Android 系统近期推送的更迭版本中,系统环境已经逐渐发展出了将部分内容和服务前置化展示的趋势。 同时,伴随着富媒体内容井喷式增长以及内容的多样化、年轻化,一款移动应用…

Windows 上创建的文件,上传到 Linux 服务器,文件名乱码?

作者 | 刘光录来源 | TIAP先来说一下问题,在 Windows 下创建的一系列文件,上传到 Linux 服务器后,出现文件名乱码,导致文件无法读取的情况。事情的起因是这样的...最近有这样一个需求:在Java Web工程中读取本地某一个文…

阿里云成为首个通过“虚拟化云平台性能测试(大规模)”的云厂商

简介:2021年7月27日,在可信云大会上,中国信息通信研究院发布了《虚拟化云平台性能评估方法》,同时,宣布了阿里云成为首个通过“虚拟化云平台性能测试(大规模)”的云厂商,并获得“202…

阿里云神龙团队拿下TPCx-BB排名第一的背后技术

简介:阿里云自主研发的神龙大数据加速引擎获得了TPCx-BB SF3000世界排名第一的成绩。 一 背景介绍 近日,TPC Benchmark Express-BigBench(简称TPCx-BB)公布了最新的世界排名,阿里云自主研发的神龙大数据加速引擎获得了TPCx-BB SF3000排名第…

从中国移动财报透视:什么在支撑移动云发展韧性?

8 月 11 日,中国移动公布 2022 年中期业绩报告。报告显示,上半年中国移动营运收入达人民币 4969 亿元,同比增长 12.0%。净利润 703 亿元,同比增长 18.9%,盈利能力全球领先。其中,移动云收入达人民币 234 亿…

vue 前期准备,项目结构

环境 1、node -v 检测 没有就下载node,装到C盘 http://nodejs.cn/download/ 2、vue -v 检测 没有就 npm install -g vue/cli 或者 yarn global add vue/cli 安装脚手架 网址 https://cli.vuejs.org/zh/ 也可以从网址里找到…

如何设计一个复杂的业务系统?从对领域设计、云原生、微服务、中台的理解开始

简介:业级应用架构是在不断的演进和迭代,但是我始终感觉企业应用架构的形成过程是在一种看起来科学的方法论下,但是又不完全科学的过程中实现的。 作者:焦方飞 大年初一,看完中国队 1:3 越南队的比赛,在思…

构建、运行、增长,亚马逊云科技发布游戏行业解决方案

云计算除了为游戏提供底层基础设施的IT资源,还能做什么? 编辑 | 宋慧 出品 | CSDN云计算 在全球游戏发展重塑的过程中,中国已经成为全球最大的数字游戏市场,Data.ai发布2022年Level Up全球52强排行榜里,有17家游戏和公…

如何从容应对复杂性

简介:软件的复杂性,是一个很泛的概念。但是一直都是开发过程中的一个难题,本文旨在探讨如何去从容应对复杂性。 作者 | 無涯 来源 | 阿里技术公众号 软件的复杂性,是一个很泛的概念。 但是一直都是开发过程中的一个难题&#xf…

js判断数据类型的几种方式

typeof 对于基本类型,除 null 以外,均可以返回正确的结果。对于引用类型,除 function 以外,一律返回 object 类型。对于 null ,返回 object 类型。对于 function 返回 function 类型。 typeof; // string 有效 typeo…

阿里巴巴开源大规模稀疏模型训练/预测引擎DeepRec

简介:经历6年时间,在各团队的努力下,阿里巴巴集团大规模稀疏模型训练/预测引擎DeepRec正式对外开源,助力开发者提升稀疏模型训练性能和效果。 作者 | 烟秋 来源 | 阿里技术公众号 经历6年时间,在各团队的努力下&#…

产学融合如何促进技术创新,英特尔打了个样

作者 | 宋慧 出品 | CSDN 经过多年的积累与扎实科研,中国的科学与技术水平正在达到和超越世界一线水平。这离不开中国有基数庞大的用户和应用场景,为科学界和工业界提供了将理论付诸实践的机会,反复打磨迭代,以提升技术指标。 作…

3大能力升级,云效+钉钉,让研发协作更「敏捷」

简介:你的团队是否面临如下问题:没有敏捷经验,不知道如何落地敏捷或者敏捷实施不规范?研发交付过程信息更新不及时,无法及时跟进交付结果?员工入职离职,多套账号权限管理难?缺乏交付…

阿里云张献涛:自主最强DPU神龙的秘诀

简介:读懂云计算,才能看清DPU热潮。 微信公众号搜索“弹性计算百晓生”,获取更多云计算知识。 如果细数最近火爆的科技概念,DPU必然位列其中。 这是英伟达一手捧红的新造富故事,是2021年SoC领域最热火朝天的创业赛道…

Gartner发布2022年新兴技术成熟度曲线,推动沉浸式、AI自动化发展

编辑 | 宋慧 供稿 | Gartner Gartner 2022年新兴技术成熟度曲线列出了25项值得关注的新兴技术,这些技术正在推动沉浸式体验的发展和扩展、加速人工智能(AI)自动化并优化技术人员交付。 Gartner研究副总裁Melissa Davis表示:“新兴…

阿里云张献涛:公共云正不断向外延伸,一云多态是未来趋势

简介:一云多态是公有云的未来趋势,包括产品的多形态、部署的多形态和生态的多形态。 编者按:2021年10月22日,在云栖大会《一云多形态部署最佳实践》分论坛,阿里巴巴集团研究员、阿里云弹性计算产品线负责人张献涛发表…

4种典型限流实践保障应用高可用|云效工程师指北

简介:4种典型限流实践保障应用高可用,本文总结了一份AHAS限流实践指南,如果你的系统有被恶意用户攻击的风险,或者系统中某个应用出现异常可能会造成雪崩效应,那么这篇文章会对你有所帮助。 大家好,我叫黄博…

超融合中国力量崛起,IDC2022年Q1报告出炉浪潮中国市场位列前三

国际数据公司(IDC)发布《2022Q1中国软件定义存储及超融合市场研究报告》,报告显示:2022年第一季度浪潮超融合销售额同比增长86.3%,近8倍于业内平均增速,市场份额跻身中国前三。 浪潮超融合在政府和金融行业…