声场合成新方法:基于声波传播的框架

      声场合成是指在房间内的麦克风阵列上,根据来自房间内其他位置的声源信号,合成每个麦克风的音频信号。它是评估语音/音频通信设备性能指标的关键任务,因为它是一种成本效益高的方法,用于数据生成以替代真实的数据收集,后者通常是缓慢的、昂贵的,并且容易出错的过程。

1 现有声场合成方法的局限性

1.1 基于测量的方法

  • 准确,但成本高,需要大量人力进行测量。
  • 需要对每个源/接收器位置组合和每种不同形状的设备进行重复测量。
  • 需要设备硬件,不适合硬件开发阶段。

1.2 基于模拟的方法

  • 通过计算声学波方程来估计房间脉冲响应 (RIR)。
  • 需要大量的计算资源,尤其是在宽带频谱下。
  • 需要对每种不同形状的设备进行重复模拟。

2 新方法

本文提供一种新方法,它结合了经验方法和模拟方法,为声场合成提供了两种方法之间的平衡。它将声场分解为两个独立的成分:房间成分和设备成分。整体声场是两个成分的复合映射。

2.1 理论基础

声学平面波是齐次亥姆霍兹方程的特征函数,是分析波动方程的强大工具。远场点源产生的声场可以用声学平面波很好地近似。

2.1.1 平面波分解

  • 平面波分解 (PWD) 是一种将声场近似为不同方向和权重的平面波叠加的方法。
  • PWD 可以近似齐次亥姆霍兹方程的局部解,并用于声场重建和声场再现等应用。

2.1.2 平面波分解的稀疏性

  • 平面波分解的系数 αl 通常具有稀疏性,即只有少量平面波对声场有显著贡献。
  • 稀疏性为使用稀疏恢复技术计算平面波分解提供了理论基础。

2.1.3 平面波分解的应用

  • 声场重建:通过测量麦克风阵列上的声场,可以计算平面波分解,并重建声源位置和声源信号。
  • 声场再现:通过控制扬声器的声场,可以再现特定的声场,例如音乐会现场的声音。
  • 声场合成:将平面波分解应用于声场合成,可以生成麦克风阵列上的声场信号。

2.2 设备声学字典

设备声学字典是一组向量,每个向量表示设备麦克风阵列在受到特定方向和频率的声学平面波照射时的总声场。

2.2.1 获取方法

  • 无响室测量:在无响室中,使用单频远场声源照射设备,并测量麦克风阵列上的声场,得到设备声学字典。
  • 数值模拟:使用有限元法 (FEM) 或边界元法 (BEM) 等数值方法,在设备表面上求解亥姆霍兹方程,得到设备声学字典。

2.2.2 作用

  • 设备声学字典是声场合成框架中连接房间分量和设备分量的桥梁。
  • 通过将房间分量的平面波分解结果与设备声学字典相结合,可以合成设备麦克风阵列上的声场信号。
  • 设备声学字典可以用于多种设备,无需针对每种设备重新计算。

2.2.3 数值模拟的细节

  • 使用 FEM 或 BEM 等数值方法,在设备表面上求解亥姆霍兹方程,得到总声场。
  • 设备表面被建模为声硬边界。
  • 为了模拟开放边界,使用完美匹配层 (PML) 技术消除内部域的反射和折射。
  • 使用标准偏微分方程求解软件包进行模拟,并通过与无响室测量结果进行比较验证模拟的准确性。

2.2.4 设备声学字典的应用

  • 声场合成:将房间分量的平面波分解结果与设备声学字典相结合,合成设备麦克风阵列上的声场信号。
  • 麦克风阵列处理:使用设备声学字典设计波束形成器,提高波束形成性能。
  • 声源定位和分离:利用设备声学字典进行声源定位和分离。
  • 去混响:使用设备声学字典进行去混响处理。

2.3 技术框架

2.3.1 框架组成

  • 房间分量:将房间内某点的声场表示为声学平面波的叠加,通过使用大麦克风阵列进行测量和稀疏恢复技术计算得到平面波分解结果。
  • 设备分量:计算设备表面对于声学平面波的响应,得到设备声学字典。
  • 合成分量:将房间分量的平面波分解结果与设备分量的设备声学字典相结合,合成设备麦克风阵列上的声场信号。

2.3.2 框架步骤

2.3.2.1 房间分量计算

  • 使用大麦克风阵列(例如 EigenMike)进行测量,获取房间内某点的声场信号。
  • 使用稀疏恢复技术对测量信号进行平面波分解,得到平面波的方向和权重。
  • 重复以上步骤,为每个房间和每个位置生成房间分量的平面波分解结果,形成房间数据库。

2.3.2.2 设备分量计算

使用无响室测量或数值模拟,计算设备表面对于声学平面波的响应,得到设备声学字典。

2.3.2.3 声场合成

  • 选择房间数据库中与目标位置对应的房间分量平面波分解结果。
  • 将设备声学字典与房间分量的平面波分解结果相结合,合成设备麦克风阵列上的声场信号。

2.3.3 框架优势

  • 分离房间声学和设备声学:将房间声学和设备声学分离,简化了声场合成的复杂性,并实现了组件的复用。
  • 减少测量/模拟开销:房间分量只需要进行一次测量,设备分量只需要进行一次计算,减少了测量/模拟的开销。
  • 提高计算效率:设备分量的计算可以在无响室中进行,并高度并行化,提高了计算效率。
  • 提高准确性:设备声学字典能够捕捉设备表面对于声学平面波的散射效应,提高了声场合成的准确性。

2.3.4 框架应用

  • 数据生成:生成合成数据,用于评估设备性能指标(例如误识率、词错误率)和训练深度学习声学模型。
  • 麦克风阵列处理:使用设备声学字典设计波束形成器,提高波束形成性能。
  • 声源定位和分离:利用设备声学字典进行声源定位和分离。
  • 去混响:使用设备声学字典进行去混响处理。

  

3 实验验证

本文通过三组实验来验证提出的声场合成框架的有效性

3.1 平面波分解验证

  • 使用 EigenMike 麦克风阵列记录两个不同的源信号,并使用稀疏恢复技术进行平面波分解。
  • 验证不同数量的平面波对声场重建误差的影响。

结果表明,少量平面波(例如 20-30 个)就能够以小于 -20 dB 的误差重建声场,证明了平面波分解的有效性。

3.2 房间脉冲响应(RIR)验证

  • 在三个不同的房间内进行实验,每个房间包含 24 个不同的位置。
  • 将 EigenMike 麦克风阵列与四种不同形状和麦克风阵列大小的设备进行共位。
  • 使用提出的框架计算每个位置的 RIR,并与实测 RIR 进行比较。

结果表明,合成 RIR 与实测 RIR 在所有频率上都高度相似,重建信号噪声比(SNR)为 19-23 dB,证明了 RIR 计算的准确性。

3.3 高级指标评估

  • 使用合成 RIR 和实测 RIR 对关键词误识率(FRR)进行评估。
  • 计算实测 FRR 和合成 FRR 之间的相对误差。

结果表明,实测 FRR 和合成 FRR 之间的相对误差小于 10%,证明了框架在评估高级指标方面的有效性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/34747.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

武汉星起航:挂牌上海股权交易中心,自营店铺销售额迎飞跃式增长

2023年10月30日,对于武汉星起航电子商务有限公司而言,无疑是一个载入史册的重要日子。这一天,公司成功在上海股权托管交易中心挂牌展示,正式登陆资本市场,开启了全新的发展篇章。这一里程碑式的跨越,不仅彰…

IDEA中Maven--下载安装自己适配的版本---理解

Maven解释: Maven是一个强大的项目管理工具和构建工具,主要用于Java项目。它能够帮助开发团队管理项目的依赖、构建项目、发布文档和报告,并能够自动化许多重复的任务。 Maven的主要作用包括: 依赖管理:Maven能够管理…

6.2 通过构建情感分类器训练词向量

在上一节中,我们简要地了解了词向量,但并没有去实现它。在本节中,我们将下载一个名为IMDB的数据集(其中包含了评论),然后构建一个用于计算评论的情感是正面、负面还是未知的情感分类器。在构建过程中,还将为 IMDB 数据…

第二期书生·浦语大模型实战营优秀项目一览

书生浦语社区于 2023 年年底正式推出了书生浦语大模型实战营系列活动,至今已有两期五批次同学参加大模型学习、实战,线上课程累计学习超过 10 万人次。 实战营特设项目实践环节,提供 A100 算力支持,鼓励学员动手开发。第 2 期实战…

【移动应用开发期末复习】第五/六章

系列文章 第一章——Android平台概述 第一章例题 第二章——Android开发环境 第二章例题 第三章 第三章例题 第四章 系列文章界面布局设计线性布局表格布局帧布局相对布局约束布局控制视图界面的其他方法代码控制视图界面数据存储与共享首选项信息数据文件SQLite数据库Content…

HarmonyOS Next开发学习手册——进程模型线程模型

进程模型 系统的进程模型如下图所示: 应用中(同一包名)的所有PageAbility、ServiceAbility、DataAbility、FormAbility运行在同一个独立进程中,即图中绿色部分的“Main Process”。 WebView拥有独立的渲染进程,即图中…

2023: 芒种集•序言

2023: 芒种集•序言 2023: 芒种集•序言 从西南旅游回来,一直忙着整理游记“2024:追寻红色足迹”,之后又应初建平索要刘桂蓉遗作“我们一起走过”,于是把“别了,老屋”和诗作“二月”一并合编,把我写的悼念…

oceanbase数据库安装和连接实战(阿里云服务器操作)

本文主要是安装oceanbase的单机版进行数据库的基础使用,oceanbase的数据库是兼容mysql数据库的,实际的兼容程度需要更深度的测试,本文主要是安装oceanbase并使用SQLynx的mysql驱动连接使用oceanbase数据库。 目录 1. 基础介绍 2. 安装说明 …

【Python datetime模块精讲】:时间旅行者的日志,精准操控日期与时间

文章目录 前言一、datetime模块简介二、常用类和方法三、date类四、time类五、datetime类六、timedelta类七、常用的函数和属性八、代码及其演示 前言 Python的datetime模块提供了日期和时间的类,用于处理日期和时间的算术运算。这个模块包括date、time、datetime和…

STL迭代器的基础应用

STL迭代器的应用 迭代器的定义方法: 类型作用定义方式正向迭代器正序遍历STL容器容器类名::iterator 迭代器名常量正向迭代器以只读方式正序遍历STL容器容器类名::const_iterator 迭代器名反向迭代器逆序遍历STL容器容器类名::reverse_iterator 迭代器名常量反向迭…

C# SerialPort串口通讯

串口通信 在.NET平台下创建C#串口通信程序,.NET 2.0提供了串口通信的功能,其命名空间是System.IO.Ports。这个新的框架不但可以访问计算机上的串口,还可以和串口设备进行通信。 创建C#串口通信程序之命名空间 System.IO.Ports命名空间中最重…

solidity智能合约如何实现跨合约调用函数

背景 比如现在有一个需求、我需要通过外部合约获取BRC20 token的总交易量。那么我需要在brc20的转账函数里面做一些调整,主要是两个函数内统计转移量。然后再提供外部获取函数。 /*** dev Sets amount as the allowance of spender over the callers tokens.** Ret…

文化财经wh6boll带macd多空转折点提示指标公式源码

文化财经wh6boll带macd多空转折点提示指标公式源码: DIFF:EMA(CLOSE,12) - EMA(CLOSE,26); DEA:EMA(DIFF,9); MACD:2*(DIFF-DEA); MID:MA(CLOSE,26);//求N个周期的收盘价均线,称为布林通道中轨 TMP2:STD(CLOSE,26);//求M个周期内的收盘价的标准差 …

onlyoffice实现在单页面加载文档的功能

草图 实现案例的基本原型 这里我们的样式库使用的是Tailwindcss,我们的前端UI组件库使用的是Ant Design Vue。 基本原型是,有个按钮,没有点击按钮的时候,页面显示的时普通的内容。当点击这个按钮的时候,页面加载文档…

【Linux】线程Thread

🔥博客主页: 我要成为C领域大神🎥系列专栏:【C核心编程】 【计算机网络】 【Linux编程】 【操作系统】 ❤️感谢大家点赞👍收藏⭐评论✍️ 本博客致力于知识分享,与更多的人进行学习交流 ​ ​ 线程概述 …

云层区分神经网络模型——二分类

云层区分神经网络模型——二分类 问奶奶,是什么让他们维护一份感情长达年,奶奶说那个年代什么东西坏了都会想要修,现在什么坏了都想着换。 安装依赖 # 要运行脚本,请先安装以下库:pip install tensorflowpip install …

JAVA每日作业day6.26

ok了家人们,今天我们学习了面向对象-多态,话不多说我们一起来看看吧 一.多态概述 面向对象的第三大特性:封装、继承、多态 我们拿一个生活中的例子来看 生活中,比如跑的动作,小猫、小狗和大象,跑起来是不一…

山水风景视频素材去哪里下?去哪里找?山水风景下载网站分享

在这个数字时代,视频已经成为最直观、有效的传达情感和分享故事的工具。对于那些渴望通过视频传递视觉美感和情感共鸣的创作者来说,拥有高质量的山水风景视频素材是关键。互联网虽然是一个信息量庞大的平台,但找到令人赞叹的山水风景视频素材…

【Linux】使用ntpdate同步时间

ntpdate 是一个在 Linux 系统中用于同步系统时间的命令行工具,它通过与 NTP 服务器通信来调整本地系统时钟。然而,需要注意的是,ntpdate 已经被许多现代 Linux 发行版弃用。 安装 yum install -y ntpdate 查看时间 date同步时间 ntpdate ntp…

问界M9累计大定破10万,创中国豪车新纪录

ChatGPT狂飙160天,世界已经不是之前的样子。 更多资源欢迎关注 6月26日消息,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东今日宣布,问界M9上市6个月,累计大定突破10万辆。 这一成绩,也创造了中国市场…