音频筑基:瞬态、基音、偏噪信号类型分析

音频筑基:瞬态、基音、偏噪信号类型分析

    • 是什么
    • 深入理解
      • 从编码角度看,基音信号编码通常会有啥问题?
      • 在频域感知编码过程中,瞬态信号会有啥问题?如何解决?
      • 瞬态信号场景下,5/10ms帧长编码有啥区别?是否短帧长更有优势?

在分析音频信号中,不同信号类型如瞬态、基音、偏噪信号是我们经常遇到的概念,这里谈谈自己的理解。

是什么


  • Transient Signal:瞬态信号
    • 时域表现:时域中信号反复突变,周期不明显,如在动态范围内突变不连续
    • 频域表现:频率成分分布广,在有限码率下,以编码频点的方式无法完全刻画
    • 信号实例:现实世界里的物品敲击音、乒乓球落地的声音
  • Pitched Signal:基音信号
    • 时域表现:时域内周期明显,相同包络信号反复拼接
    • 频域表现:频域内表现为一根根谐波,层次分明
    • 信号实例:人声清唱、钢琴音、琴弦扫弦音
  • Noise Signal:偏噪信号
    • 时域表现:时域内呈现随机性,变化剧烈
    • 频域表现:频谱铺的很满,在基波和次谐波上叠加了许多早是你提供
    • 信号实例:乐器嘈杂的流行乐,背景嘈杂的摇滚乐

基音的概念:

基音是指声音中最低的频率成分,也就是声音的基础频率,它是声音音调的主要决定因素之一。

简单说,分析声音信号的频谱,找出其中最强的频率成分,这个频率就是声音的基频或基音。

深入理解


从编码角度看,基音信号编码通常会有啥问题?

  • 基音信号一般周期会大于帧长,导致无法准确获取谐波。常见的解决方式是加入长短窗切换。

在频域感知编码过程中,瞬态信号会有啥问题?如何解决?

  • 时域编码对瞬态信号表现好,瞬态为突变信号,频域特征不明显,不利于编码表达。
  • 瞬态信号通常会在频域编码中产生预回声问题

常见解决方法:

  • 长短窗切换,遇到瞬态信号用短窗变换。自适应窗切换技术是感知音频编码技术领域的一项重要技术,其主要作用是抑制暂态信号引起的预回声问题。
  • TNS,在编码段,TNS技术对检测到的暂态信号的频谱系数进行线性预测分析,在解码端,对暂态信号进行频谱预测合成,可以调节误差的形状以适应输入音频信号的时域形状,从而将编码噪声置于解码信号之下,大幅降低量化噪声对解码后音频主观听觉的影响。

瞬态信号场景下,5/10ms帧长编码有啥区别?是否短帧长更有优势?

  • 客观上,同码率下,短帧长总体残差是要大于长帧长。
  • 主观上,短帧长预回声现象减少,突变更清脆,有瞬态感,主观听感短帧长控制的更好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/232207.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HamronyOS 自动化测试框架使用指南

概述 为支撑 HarmonyOS 操作系统的自动化测试活动开展,我们提供了支持 JS/TS 语言的单元及 UI 测试框架,支持开发者针对应用接口进行单元测试,并且可基于 UI 操作进行 UI 自动化脚本的编写。 本指南重点介绍自动化测试框架的主要功能&#x…

欧非源国际交易平台在2023中非经济贸易大湾区论坛首次亮相

12月16日,2023中非经济贸易大湾区论坛在鹏城隆重召开,欧非源国际交易平台首次亮相。来自非洲部分国家的驻华使节、中非经济贸易委员会领导以及商(协)会、企业家代表共同见证了欧非源国际交易平台的发布,亲历了该平台与…

机器学习 | 线性算法 —— 大禹治水

Machine-Learning: 《机器学习必修课:经典算法与Python实战》配套代码 - Gitee.com 如果说KNN算法体现了人们对空间距离的理解, 那么线性算法则体现了人们对事物趋势上的认识。 注意图中横纵坐标的不同。 线性回归、多项式回归多用于预测,逻辑…

Jupyter的简单实用

一、Jupyter 简介 Jupyter是一个基于网页的交互式计算机应用程序,支持多种编程语言,包括但不限于Python、R、Julia等。它提供了一个便捷的环境,允许用户在浏览器页面中直接编写、运行代码,以及查看结果。此外,Jupyter…

Manacher算法(马拉车)

Manacher(马拉车)算法 作用:在On的时间复杂度下,求出字符串每个回文中心的最长回文半径 回文半径:以回文中心为起点,到回文串两端的距离 如:# a # b # a # 以b为回文中心,最长回文半…

Springboot+Mybatis入门案例

一、项目结构 1.导入依赖 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apach…

实现基于 Keepalived 和 Nginx 的高可用架构

目录 前言1 高可用性简介2 准备服务器和软件3 高可用的配置&#xff08;主从配置&#xff09;3.1 配置/etc/keepalived/keepalived.conf文件3.2 配置/usr/local/src/nginx_check.sh脚本文件 4 启动软件5 测试结语 前言 在现代互联网架构中&#xff0c;高可用性是至关重要的。N…

<九>JavaScript中的基本数据类型和引用数据类型

一、栈内存和堆内存 基本数据类型&#xff08;值类型&#xff09;存放在“栈内存”中。引用数据类型&#xff08;对象类型&#xff09;存放在“堆内存”中。栈内存和堆内存是一种对内存的管理方式和模型概念&#xff0c;不存在物理分割。 “栈”具有线程和“先进后出”的特点…

GBJ2510-ASEMI逆变器专用整流桥GBJ2510

编辑&#xff1a;ll GBJ2510-ASEMI逆变器专用整流桥GBJ2510 型号&#xff1a;GBJ2510 品牌&#xff1a;ASEMI 封装&#xff1a;GBJ-4 最大平均正向电流&#xff1a;25A 最大重复峰值反向电压&#xff1a;1000V 产品引线数量&#xff1a;4 产品内部芯片个数&#xff1a;…

基于ssm防疫信息登记系统的设计与实现论文

摘 要 现代经济快节奏发展以及不断完善升级的信息化技术&#xff0c;让传统数据信息的管理升级为软件存储&#xff0c;归纳&#xff0c;集中处理数据信息的管理方式。本防疫信息登记系统就是在这样的大环境下诞生&#xff0c;其可以帮助管理者在短时间内处理完毕庞大的数据信息…

配置https环境

为什么要配置https环境 在使用 HTML5 的 API 时&#xff0c;很多 API 只能在 https 保证安全的情况下才能开启。这就要求我们在本地开发环境也能够配置 https&#xff0c;否则你需要每次部署到配有 https 的测试环境中才能看到预览效果&#xff0c;这对开发的敏捷度造成了极大…

网络空间搜索引擎- FOFA的使用技巧总结

简介 FOFA是一款网络空间测绘的搜索引擎&#xff0c;旨在帮助用户以搜索的方式查找公网上的互联网资产。 FOFA的查询方式类似于谷歌或百度&#xff0c;用户可以输入关键词来匹配包含该关键词的数据。不同的是&#xff0c;这些数据不仅包括像谷歌或百度一样的网页&#xff0c;还…

使用opencv将Mat图像resize成检测输入的letterbox类型

1.python代码 a.resize def my_letter_box(img, size(640, 640)): #h, w, c img.shaper min(size[0] / h, size[1] / w)new_h, new_w int(h * r), int(w * r)top int((size[0] - new_h) / 2)left int((size[1] - new_w) / 2)bottom size[0] - new_h - topright size[1…

AI语音电话机器人识别技术声音合成声音是怎么实现的

AI语音识别技术的声音合成是通过将文本转换为声音信号的过程实现的。这个过程包含以下步骤&#xff1a; 文本分析和处理&#xff1a;首先&#xff0c;输入的文本会接受分析和处理。这可能涉及到词法分析、语法分析和语义分析等技术&#xff0c;用于理解文本的含义和上下文。 …

【Mybatis】日常知识点随笔(持续更新)

目录 【K】Mybatis使用Select注解书写简单sql 【K】MySQL 数据类型与 Java 类型的对应关系 【K】Mybatis相同代码复用 1. 定义公共 SQL 片段 2. 引用公共 SQL 片段 3. 使用参数 4. 复用和组合 5. 注意事项 【K】mysql如何实现插入一条数据后立刻获取该数据自增长id进行…

鸿蒙(HarmonyOS)项目方舟框架(ArkUI)更改应用图标

鸿蒙&#xff08;HarmonyOS&#xff09;项目方舟框架&#xff08;ArkUI&#xff09;更改应用图标 一、操作环境 操作系统: Windows 10 专业版 IDE:DevEco Studio 3.1 SDK:HarmonyOS 3.1 二、更改图标 图标的位置&#xff1a;entry->src->main->resources->-b…

智慧校园2.0物联网管理平台建设方案:PPT全文22页,附下载

关键词&#xff1a;物联网解决方案&#xff0c;智慧校园解决方案&#xff0c;物联网平台建设方案&#xff0c;物联网应用技术 一、智慧校园2.0物联网管理平台建设背景 1、教育现代化和强国建设的需要&#xff1a;近年来&#xff0c;国家为了加快推进教育现代化、教育强国建设…

java SpringCloud版本b2b2c鸿鹄云商平台全套解决方案

使用技术&#xff1a; Spring CloudSpring BootMybatis微服务服务监控可视化运营 B2B2C平台&#xff1a; 平台管理端(包含自营) 商家平台端(多商户入驻) PC买家端、手机wap/公众号买家端 微服务&#xff08;30个通用微服务如&#xff1a;商品、订单、购物车、个人中心、支…

kubernetesr安全篇之云原生安全概述

云原生 4C 安全模型 云原生 4C 安全模型&#xff0c;是指在四个层面上考虑云原生的安全&#xff1a; Cloud&#xff08;云或基础设施层&#xff09;Cluster&#xff08;Kubernetes 集群层&#xff09;Container&#xff08;容器层&#xff09;Code&#xff08;代码层&#xf…

CMake初始用

CMake常见语法 CMakeLists.txt 的语法比较简单,由命令、注释和空格组成,其中命令是不区分大小写的,符号"#"后面的内容被认为是注释。命令由命令名称、小括号和参数组成,参数之间使用空格进行间隔。 PROJECT(hello_cmake)&#xff1a;该命令表示项目的名称是 hello_…