AOMedia发布免版税沉浸音频规范IAMF

11月10日,开放媒体联盟(AOMedia)发布了旗下首个沉浸式音频规范IAMF(https://aomediacodec.github.io/iamf/),IAMF是一种编解码器无关的容器规范,可以携带回放时间渲染算法和音频混音的信息,而且和旗下的AV1视频标准一样为免版税。

从AV1开始,AOMedia就在用开放来对抗老牌的标准组织ITU与ISO/IEC的HEVC、VVC等标准。目前,AV1已经成为主流视频平台的主力标准,包括Netflix、Meta、苹果等都在持续扩大AV1的应用部署。同样,IAMF也自然成为对抗商业沉浸式音频方案的主力。目前,业界影响力最大的沉浸式音频解决方案是杜比(Dolby Atmos),苹果就采用了Dolby Atmos作为自身沉浸式音频的解决方案。考虑到杜比在多媒体生产与消费领域拥有全方位的渗透,苹果选择杜比是顺其自然的。此外,全景声科技也是沉浸式音频主要的解决方案商。

AV1的成功在于AOMedia把多媒体各个关键环节的企业拉到了一起,从内容生产侧的工具、内容IP所有者,分发渠道OTT,终端设备商、芯片和关键技术服务商。当然,AV1的成功也得益于HEVC混乱的版税机制的助攻。

9642852b1f218190428fb4e90605c499.jpeg

根据三星发布的新闻稿显示,IAMF项目始于2020年,由三星和Google共同开发,并最终成为AOMedia发布。三星是AOMedia的创始成员。尽管苹果也是AOMedia创始成员,但在自己的生态中依然采用了更加成熟的Dolby Atmos作为沉浸式音频解决方案。AOMedia的成员中还包括Amazon、Meta、微软、Netflix、腾讯、oppo、Vimeo等内容平台方,这些平台的选择将很大程度决定IAMF的命运。

IAMF的关键亮点如下:

适用于所有设备的空间音频:IAMF可以将基于通道和基于场景的全景声空间音频演示无缝传送到包括耳机、移动电话、电视机、家庭影院和网络在内的各种设备上。这种多功能性确保在各个平台上提供一致的高质量音频体验。

灵活的音频传输:IAMF提供了一种灵活的方法,可以将不同类型的音频元素传输到终端设备上。无论是将3.1.2通道音频与立体声音频相结合,IAMF都可以实现。IAMF提供了一种信号渲染算法(例如EAR和BEAR)的方式,以便在扬声器布局和耳机中播放。

创作者友好:创作者可以使用现有的开源插件,如EAR Production Suite,开始创建符合IAMF规范的沉浸式音频内容,该插件包括多扬声器布局和双耳监控的渲染器。IAMF能够携带并包含多个音频混音配置,使创作者和用户能够根据不同的播放偏好进行可控的响度调整。在不久的将来,AOMedia开源参考软件将添加一种IAMF编码工具,用于将各种音频混音压缩为IAMF。

AI驱动:IAMF利用人工智能和深度学习技术来分析场景,并突出内容的某些方面,调整音频水平以增强整个观看体验中的声音效果。使用IAMF技术,用户将能够根据自己的喜好自由调整声音。无论观众想要增强动作场景的音效还是增强对话的清晰度,IAMF都为他们提供了自定义内容音频的灵活性,以实现更个性化的体验。

你可以在这里(https://github.com/AOMediaCodec)找到IAMF规范和参考软件解码器,以及完整的测试流。

据三星研究院视觉技术团队的WooHyun Nam透露,三星研究团队目前正在开发IAMF技术的高级版本,可应用于移动设备、元宇宙、视频游戏等领域。

参考信息:

https://aomedia.org/press%20releases/AOMedia-Advances-the-Audio-Innovation-Era/

https://news.samsung.com/global/interview-movie-quality-audio-from-the-comfort-of-your-home-meet-the-leaders-of-next-generation-3d-audio-technology

c774d72dadfcd1039a805f14da742d9d.png

▼点击下方阅读原文 ▼

进入LiveVideoStackCon 2023深圳站官网 了解更多精彩演讲

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/143229.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

矩阵置零00

题目链接 矩阵置零 题目描述 注意点 使用 原地 算法 解答思路 思路是需要存储每一行以及每一列是否有0,因为要尽可能使用更少的空间,且新设置为0的格子不能对后续的判断产生影响,所以要在原有矩阵上存储该信息先用两个参数存储第一行和第…

ISP图像处理Pipeline

参考:1. 键盘摄影(七)——深入理解图像信号处理器 ISP2. Understanding ISP Pipeline3. ISP图像处理流程介绍4. ISP系统综述5. ISP(图像信号处理)之——图像处理概述6. ISP 框架7. ISP(图像信号处理)算法概述、工作原理、架构、处理流程8. ISP全流程简介9. ISP流程介…

《视觉SLAM十四讲》-- 后端 1(上)

文章目录 08 后端 18.1 概述8.1.1 状态估计的概率解释8.1.2 线性系统和卡尔曼滤波(KF)8.1.3 非线性系统和扩展卡尔曼滤波(EKF)8.1.4 小结 08 后端 1 前端视觉里程计可以给出一个短时间内的轨迹和地图,但由于不可避免的…

GPT 写作与改编

GPT 写作与改编 文商科GPT 写作收益 改编技巧【改编一段话】【改编评价】【意识预设】落差,让顾客看到就感性和冲动害怕,让顾客看到就想买和拥有画面,切换空间,瞬间代入,勾人魂魄对比,设置参考物&#xff0…

保序回归:拯救你的校准曲线(APP)

保序回归:拯救你的校准曲线(APP) 校准曲线之所以是评价模型效能的重要指标是因为,校准曲线衡量模型预测概率与实际发生概率之间的一致性,它可以帮助我们了解模型的预测结果是否可信。一个理想的模型应该能够准确地预测…

互斥量保护资源

一、概念 在多数情况下,互斥型信号量和二值型信号量非常相似,但是从功能上二值型信号量用于同步, 而互斥型信号量用于资源保护。 互斥型信号量和二值型信号量还有一个最大的区别,互斥型信号量可以有效解决优先级反转现 象。 …

立仪科技光谱共焦在半导体领域的应用

半导体技术在近年来以极快的速度发展,对质量和精密度的要求也不断提升。在这样的背景下,用于材料与设备研究的先进检测技术如光谱共焦成像将自然地找到一席之地。下面我们将详细探讨一下光谱共焦在半导体领域中的应用。 光谱共焦技术,通过在细…

【Linux】进程等待

文章目录 tips一、进程等待是什么?二、为什么要有进程等待?三、怎么做到进程等待?先看看什么是进程等待wait和waitpidstatus参数options参数非阻塞轮询 进程等待的原理 总结 tips 下面的代码可以循环检测进程。 while :; do ps ajx | head …

长安汽车基于 Apache Doris 的车联网数据分析平台建设实践

导读:随着消费者更安全、更舒适、更便捷的驾驶体验需求不断增长,汽车智能化已成必然趋势。长安汽车智能化研究院作为长安汽车集团有限责任公司旗下的研发机构,专注于汽车智能化技术的创新与研究。为满足各业务部门的数据分析需求,…

【广州华锐互动】消防科普VR实训展馆增强群众学习兴趣和沉浸感

在现代社会,科技的发展已经深入到我们生活的各个角落,其中包括教育和信息传播领域。3D技术的引入为科普教育提供了全新的可能性。特别是在消防安全教育中,消防科普VR实训展馆的应用,不仅可以提高公众的消防安全意识,还…

用户画像与用户分层

用户画像是重要的数据产品和运营抓手,指能够描述和刻画用户信息和的数据指标。通过用户画像,业务经营团队可以充分、深入、准确地了解用户在不同生命周期的特征,来制定高效的用户经营策略。用户画像,不论 Persona 还是 Profile &a…

C#多线程的操作

文章目录 1 使用线程意义2 C#线程开启的四种方式2.1 异步委托开启线程2.2 通过Thread类开启线程2.3 通过线程池开启线程2.4 通过任务Task开启线程 3 前台线程和后台线程简述3.1 前台线程3.2 后台线程 4 简述Thread和Task开启线程的区别4.1 Thread效果展示4.2 Task效果展示4.3 区…

WP光电信息学院2023年网络安全季度挑战赛-测试赛

签个到就跑WP Misc MISC-没爱了,下一个 下载附件压缩包解压之后,获得一个流量包文件 使用wireShark打开流量包,Ctrl F 搜索flag{即可获得flag flag{Good_b0y_W3ll_Done}MISC-送你一朵小花花 下载附件压缩包解压之后,获得一…

普通测径仪升级的智能测径仪 增添11大实用功能!

普通测径仪能对各种钢材进行非接触式的外径及椭圆度在线检测,测量数据准确且无损,可测、监测、超差提示、系统分析等。在此基础上,为测径仪进行了进一步升级制成智能测径仪,为其增添更多智能化模块,让其使用更加方便。…

element 周选择器el-date-picker

2023.11.13今天我学习了在使用element 周选择器的时候&#xff0c;我们会发现默认的时间选择为星期日到下一个星期一&#xff0c;如图&#xff1a; 我们需要改成显示星期一到星期天&#xff0c;只需要加一行代码&#xff1a;picker-options <el-date-pickertype"week&…

【postgresql】 代替mysql的if函数

在postgresql 中用 COALESCE 来代替mysql中的 if &#xff1b; COALEASE 函数的语法如下&#xff1a; COALESCE(expression_1, expression_2, expression_3, ...) COALESCE 函数接受多个参数&#xff0c;并且返回第一个非空的参数值&#xff1b; 如果所有参数都为空值&…

一本了解生成式人工智能

上周&#xff0c;发了一篇关于大语言模型图数据库技术相结合的文章&#xff0c;引起了很多朋友的兴趣。当然了&#xff0c;这项技术本身就让俺们很兴奋&#xff0c;比如我就是从事图研发的&#xff0c;当然会非常关注它在图领域的应用与相互促就啦。 纵观人类文明历史&#xff…

【论文精读2】R-MVSNet

R-MVSNet【递归多视图立体网络】&#xff0c;论文全名&#xff1a;“Recurrent MVSNet for High-resolution Multi-view Stereo Depth Inference”&#xff0c;CVPR 2019(CCF A) 在MVSNet的基础上做了一些改进&#xff0c;主要解决的问题是代价体正则化&#xff08;Cost Volume…

三、Eureka注册中心

目录 一、作用及调用方式 二、搭建eureka注册中心 三、注册user-service和order-service 四、新增实例 五、服务拉取 六、总结 一、作用及调用方式 在服务提供者启动时&#xff0c;它会向eureka注册中心提供自己的信息&#xff0c;并每30秒进行一次刷新eureka注册中心保存…

ping: www.baidu.com: Name or service not known解决办法

解决服务器无法ping通外网问题 1、问题描述&#xff1a; 配置了网卡信息&#xff0c;发现还是无法访问外网&#xff0c;并报ping: www.baidu.com: Name or service not known信息 2、问题原因&#xff1a; 这就是外网没开通好 3、解决方法&#xff1a; 修改网卡文件&#xff…