荔枝音质高保真AI降噪技术分享

“荔枝音频处理目标就是两个字:清静——清晰、安静。让用户听得更清晰、更真切、更好。”荔枝集团技术副总裁刘晓宇谈及音频技术要攻克的几个难点时一针见血地提到。

随着疫情下直播、在线社交、在线课堂、在线会议等快速发展和元宇宙产业不断壮大,音频技术在其中扮演的角色越来越重要。但当下流行视频直播、音视频群聊、1对1语音匹配聊天等社交场景,却常常伴随吵闹的环境噪声,如键盘敲击声、家里宠物吵闹声、儿童哭闹声等,这些都会通过互动场景传送到接受者耳中,语音社交过程充满干扰。

近日,从位于大湾区“中国音频第一股”荔枝集团获悉,该公司大湾区的音频技术团队使用硬件或软件降噪、不同软件降噪算法、降噪与场景结合等方法,引入AI降噪,可以有效抑制互动文娱场景下音视频通话过程中的背景噪声,并保证语音无损伤,最终有效提升在多种复杂场景下的实时互动体验。目前,荔枝音质高保真的降噪技术领跑全球。

荔枝集团技术副总裁刘晓宇此前参加华为开发者大会

  1. 大湾区团队AI降噪实现强降噪、高保真,领跑世界

随着疫情在线互动娱乐普及,直播互动文娱场景重要性凸显。荔枝集团音频技术负责人魏敦晓介绍,不同的在线场景对于音频高音质的体验需求不一样。比如教育类场景中,其着重在于知识的获取和声音清晰,及时互动;会议类场景则看重语音的流畅度和清晰度;而文娱场景中,除了有趣的内容吸引用户外,音频的高音质体验和互动性功能,是让用户愿意持续参与的其中一个最重要因素。

随着算力持续增长,基于大数据训练的AI语音降噪算法具有强大的能力,使实时AI语音降噪算法在互动娱乐场景中成为可能。相比于传统的降噪算法,荔枝技术团队自研的 AI 降噪的效果有巨大提升,对直播场景可能经常会遇到敲键盘、喝饮料、背景讨论等噪声能进行有效抑制乃至降低到最低影响。

“互动娱乐业务场景中要求对全频带进行降噪,考虑到CPU性能和降噪处理时间,采用一种混合架构来对全频带进行降噪,低频采用AI模型处理,高频采用传统降噪处理。”魏敦晓表示。

在大量的用户使用和反馈中,荔枝音频技术团队发现,互动娱乐社交产品使用场景中,瞬态噪声占比较多,特别是触碰声、吃薯片等居家场景这类声音占比很大。

荔枝技术团队利用站内海量的语音样本,训练的这个 AI降噪模型,能够过滤掉不需要的声音,因此每个人的音频都可以更加清晰传递到接收者耳朵里,即使大家同时发言,特别是荔枝App内多人语音连麦场景下。“AI降噪与传统降噪相比,有更强的降噪能力,但对语音损伤的可能性较大,但是荔枝AI降噪对语音几乎没有损伤,使每个人的声音高保真地传输。”

此外,荔枝音频研发人员选择业务占比前10的手机机型进行大量实验和反馈,确保主流平台以低音质损伤、高性能、低功耗方式运行,使用户的设备不卡、不烫。

据介绍,荔枝在音频互动文娱场景下的音质高保真的AI降噪技术已经领跑全球,为大湾区乃至国内下一步的互动娱乐场景下音频娱乐沉浸式体验开发奠定了良好的基础。

2. 互动娱乐场景理解新突破

音频行业AI技术发展到目前,算法、数据外场景和行业知识成为了一个关键。发展就是要让声音做到“声临其境”。消灭所有会影响现场感的因素像噪声、回声、杂音等,然后根据所处的真实或虚拟的环境,重塑其中的音源和空间感知。

荔枝APP常见场景是直播+连麦的场景,即主播大部分时间是单人直播,用户一般以听众角色收听,但有时也可以通过点代表连麦的按钮上线,主播收到连麦请求后,若通过,则此用户可与主播在RTC的系统里进行实时互动。

主播可以依赖强大的主播引擎为直播添加音乐或音效播放、也可以调用调音台进行声音美化或通过变声增强互动的娱乐性。此场景下,多个主播在房间中进行互动或娱乐表演,而用户既可以收听、也可以上麦和主播们互动社交。主播或用户是处在一个RTC系统里,而听众既可以加入RTC系统,也可以通过CDN进行拉流。

要做降噪首先就是做声音理解,通过声音理解去分析场景中各种音频。用户玩荔枝社交产品时候,喜欢吃着薯片、敲着键盘、喝着冰镇汽水,然后各种触碰声音。生活中噪音类型很多,甚至是在家做饭的声音、家用电器扫地、台风天气风噪。这些声音要处理好的话,行业内公认技术是最难的。

“深入理解降噪需要先理解我们的产品要解决什么噪声,再去降噪抑制这些噪声,这是跟业务场景很贴合的一种创造。”

魏敦晓介绍,互动娱乐场景相比其他场景,其技术差异方向主要在不同外设的接入、多条通道的支持、AI变声需求、声音的理解以及链路音质的提升等方面。跟会议场景声音源主要来源采集输入通道不一样,文娱场景为了丰富娱乐性,在主播端要支持音乐播放通道、音效播放通道、屏幕共享通道等。当主播进行才艺表演或播放音乐时,整个互动娱乐场景对于音质的要求就会提高。从音频体验来讲,要让用户像在本地一样声临其境沉浸式的参与到互动场景当中,不受各种身边噪音输入干扰,这也成为了音频行业的一大技术难点。

“荔枝音频的AI降噪是找到那些噪音的特征进行针对性的降。AI就是喂它什么,它就能干什么。我们把敲击声、碰撞声、噪音灌到这个学习系统里,AI认识了这个东西,后面可以把它处理掉。”荔枝技术人员会针对性录一些声音训练算法。

不过,刘晓宇也补充到,在主要语音场景上,算法带来的差异并不大(硬件会掩盖差距),在一些硬件不覆盖的场景,比如音乐场景,屏幕分享中的视频声音场景,对音质有较高要求,这要求在核心算法上有突破,“目前看,这对整个行业都是比较大挑战,团队正在做相关的技术研究以应对将来的场景。”

有大厂的业内资深人士评价此项技术表示,荔枝的AI降噪在音质保护方面达到了“出乎意料的高水准”。

荔枝技术副总裁刘晓宇总结,随着元宇宙的到来,用户对声音的质量、沉浸式体验要求越来越高,接入设备的效果、低延时、空间音频技术、环境声学模拟等,均是目前音频互动娱乐需要攻克的难点。荔枝技术团队正在不断奋力向前,继续推动中国互联网音频社交技术处于世界领先地位。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/511348.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

19年兰州大学计算机分数线,兰州大学2019年在广东省录取分数线

免费申请学习规划请选择在读年级学前小学初中高中大学留学其他已为10472位学员提供学习规划*验证码*短信验证码{"text1":{"label":"薄弱科目","placeholder":"请输入你的薄弱科目","required":1,"formType&q…

最佳实践丨构建云上私有池(虚拟IDC)的5种方案详解

简介:云上私有池系列终篇终于来了,本文将重点介绍构建云上的私有池(虚拟IDC)的多种方案和各自的优缺点,并给出相关的性价比优化建议。 本文作者:阿里云技术专家李雨前 摘要 围绕私有池(虚拟I…

阿里云万郁香:多样付费选择构筑成本最优的弹性体验

简介:云上成本优化三部曲:云上资源归属拆解、确定资源需求及购买优先级、选择最佳的付费方式。 2021年12月21日,阿里云弹性计算年度峰会在上海举行,本次峰会通过全实景直播的形式为大家呈现。峰会上,阿里云弹性计算高…

智能分层、满足更高工作负载,亚马逊云科技加速云端存储服务创新

编辑 | 宋慧 出品 | CSDN 云计算 分布式存储 Amazon S3、弹性计算 Amazon EC2,都是亚马逊云科技的当家产品。在云原生、人工智能、数据分析领域继续发挥技术优势,夯实云技术领先的地位之后,亚马逊云科技在存储领域的研究和发展也没有止步不前…

计算机开机黑屏,开机黑屏,电脑无法进入系统

win10开机进安全模式我相信经常用电脑的童鞋也遇到过这样的问题,就是桌面上什么都没有,电脑也开着。怎么了?通常,不显示桌面有很多原因。如何解决这个问题?等等,别担心,小...相信经常使用电脑的…

最佳实践丨三种典型场景下的云上虚拟IDC(私有池)选购指南

简介:业务上云常态化,业务在云上资源的选购、弹性交付、自助化成为大趋势。不同行业的不同客户,业务发展阶段不一样,云上资源的成本投入在业务整体成本占比也不一样,最小化成本投入、最大化业务收益始终是不同客户间的…

客流量总是少?是你门店选址出了问题!

零售行业最本质的需求就是降本增效、引流提销,实现利润最大化。如何利用大数据、人工智能、云计算、AIOT等前沿技术,助力企业数智化转型,全生态效率提升和可持续发展,是零售企业的核心诉求。 零售行业客流管理的现状 零售行业已进…

大数据领域的专精特新“小巨人”中科闻歌

客户故事 中科闻歌创立于2017年3月。在成立的四年内,它完成了五轮融资,被评为国家级专精特新“小巨人”企业。2020年,中科闻歌与阿里云展开合作,通过云服务器 ECS(Elastic Compute Service)为核心业务提供底…

计算机网络c类网络划分子网介绍,IP地址的子网划分详解

原标题:IP地址的子网划分详解来源:今日头条北京炫亿时代一、子网划分基础1、子网划分的若干个好处:①减少网络流量②提高网络性能③简化管理④可以更为灵活的形成大覆盖范围的网络2、你最好遵循以下步骤来进行子网划分:①确认所需…

直播回顾:准确性提升到 5 秒级,ssar 独创的 load5s 指标有多硬核?| 龙蜥技术

简介: 你还在为分析机器负载高而苦恼?这款 ssar 工具独创 load5s 指标精准定位超硬核。 编者按:本文整理自龙蜥SIG技术周会,作者闻茂泉,阿里云计算平台事业部SRE运维专家,是龙蜥社区跟踪诊断SIG核心成员…

dos系统重启计算机名,dos系统重启的命令是是

用DOS命令可以实现很多功能,而且有时候这相对于其他方法比较简单易行,下面就让学习啦小编教大家用dos系统重启的命令,还有自动关机和注销等功能。dos系统重启的命令按快捷键“winR”,输入cmd后按回车进入DOS环境:输入命…

如何搭建云原生大数据平台的K8s底座

作者 | 智领云科技云平台研发经理 金津 供稿 | 智领云科技 伴随着数字化转型脚步的加快,大数据已成为企业经营管理的主要手段之一,越来越多的行业也选择通过大数据来实现业绩增长。今年年初,CNCF中国区总监陈泽辉在2022云原生超级英雄会上表…

用好这28个工具,开发效率爆涨

简介:用好这28个工具,开发效率爆涨。本文我将主要从Terminal 和 Desktop 2个大类、8个核心开发场景介绍一下我最常使用的效率工具,及如何通过这些工具来提升程序员「幸福感」的实践。 大家好,我是秦世成,我在云效负责…

文石服务器维护,文石BOOX OS 2.0新系统即将上线,联合京东读书推出BOOX书城

原标题:文石BOOX OS 2.0新系统即将上线,联合京东读书推出BOOX书城作为行业领先的电纸书品牌,文石多年来一直致力于完善BOOX电纸书的功能,优化系统,提高性能,简化操作,力图在开放性和傻瓜式之间寻…

Docker 那些事儿:如何安全地停止、删除容器?

作者 | 飞向星的客机来源 | CSDN博客🌟 前言本篇文章将会讲讲如何停止、删除容器和对容器进行资源限制。停止和删除容器🍑 停止容器在工作中,有时会需要将容器暂停,例如,要为容器文件系统做一个快照时。使用 docker pa…

独家专访阿里云存储负责人吴结生:我经历的三个重大决策

简介:云原生正在重新定义存储,而存储只是基础软件领域中的一环。本期 C 位面对面,我们有幸邀请到了阿里巴巴高级研究员,阿里云智能存储负责人吴结生(Jason Wu),他亲历了阿里云存储技术高速发展的…

梦想加:联合办公智能化之路

2018年梦想加携手阿里云,通过云服务器ECS进行弹性的资源调度,通过弹性伸缩从容应对突发性流量洪流,灵活启停应用环境降低资源成本。 创始人介绍 ​梦想加创始人兼CEO王晓鲁,1982年生于北京,连续创业者,200…

自己虚拟服务器都用json可以吗,vue+webpack项目中使用dev-server搭建虚拟服务器,请求json文件数据,实现前后台分离开发...

在项目开发中,前后台分离,做了假数据,项目使用vue2.0重构,后台也推到重来了,为了不耽误开发进程,我做了虚拟的数据请求,使用vue-cli脚手架搭建的项目文件中dev-server搭建虚拟api请求&#xff0…

如何检查 Linux 服务器的运行时间

作者 | 刘光录来源 | TIAPLinux 中的 uptime 用于查看系统启动后的运行时间。它是一个比较简单的 Linux 命令,可以不带参数直接运行:uptime这将显示一行输出,显示当前时间、正常运行时间(以天和小时为单位)、当前登录到…

宜创科技:低代码技术赋能企业数字化

数字科技的魅力就在于用技术赋能企业,助力企业成长,在阿里云创新中心平台上,也孵化出了一批低代码创业公司,宜创科技就是其中一家。 使命和愿景 宜创无代码的使命是,无代码技术赋能每一个企业数字化;愿景…