Chapter 5:Spectral-Subtractive Algorithms

作者:桂。

时间:2017-05-24  10:06:39

主要是《Speech enhancement: theory and practice》的读书笔记,全部内容可以点击这里。

书中代码:http://pan.baidu.com/s/1hsj4Wlu,提取密码:9dmi


 一、谱减的基本原理

  A-基本问题

基本模型是加性噪声:

频域模型:

所谓谱减法,可以通过不同的假设进行,一般的:

通常为了避免幅值出现负数,加上一个半波整流。这时的幅度估计+带噪信号的相位,即可得出降噪的信号。

  B-典型

分别取 p = 1, p = 2分析。

p = 1时,谱减

p = 2时,谱减

可以看出p = 2是基于统计无关的假设:

反过来看看p = 1的情形,可以写成:

也就是clean信号与noise相位相同,且统计相关。

对比来看,p =  2的假设在应用场景里应该比 p = 1更合理,尽管作为非平稳信号,完全无关的假设难以严格满足。p取其他值的分析类似

谱减法的基本框架:

 

回顾上面的谱减法,理论分析的前提是基于频点,事实上许多应用场景里,noise与clean(特别是在高频区域)满足一定的正交性,即该频点完全属于clean/noise,而非二者的混合,从这一点来说p的不同取值带来的影响远没有理论中体现的那么大。下图也说明了:高频部分的正交性更明显。

二、谱减法的不足

1-带来了Musical noise

谱减过程中没有完全消除噪声,而把峰值保留了下来,造成Musical noise:

2-相位失真

相位不准确带来的信号失真,带噪的相位来表达clean的相位,造成语音的可懂度下降(书中指出SNRs (<0 dB),其实这么说是不合适的,噪声与信号正交程度越小,这种论证才有意义).

三、其它谱减法

  A-Boll的过减法

Boll的思路其实就是平滑,如果平滑呢?这里没有用线性平滑,而是用了一个min/max{相邻帧信息}的思路,为了防止毛刺:1)谱减的门限D尽可能Max,2)信号的估计尽可能min

Berouti等人也提出了一种方法:

这个思路的核心在于β的选取,其实就是为了减少毛刺引入了填充,其中

,图中可以观察到β的影响:

  B-非线性谱减

这个的动机是:现实中,噪声对所有频段的影响,并不是均衡的,按上面的思路过于粗糙,例如汽车噪声,可能在某一频段干扰明显,又比如一些噪声对于低频影响更大。非线性谱减的基本规则:

核心在于a(w)不再是一个常数,取值与频率有关。其中的参数一般平滑与处理一下

a通常取非线性函数

其中ρ

信噪比越大,a越小。 

  C-多带谱减法

多带谱减也可以归类为非线性谱减,其实就是分自带计算,类似分治法

谱减的思路可以按照上面任何一个方法,不同的是用了两个参数:α、

对于α:

其中

对于

多带的实现框图

  D-MMSE谱减法

 上面提到的谱减法,可以有一种广义的定义方式

且上面的方法都是通过实验经验设定参数,其实对于参数γ、α可以借助MMSE(最小均方误差估计)/其他准则合理即可:

得出的参数估计(细节可参考这里)

其中

从而得出降噪结果:

这里用到一个粗糙但简便的假设:噪声谱与干净信号谱的相位相同

如果假设,可以得到类似的降噪算法

其中是与p有关的常数,如对应。得到估计之后可以通过上面提到一些方式作进一步的后处理。

这个方法的关键在于:作为一个理论值,实际应用如何估计它?

直观的思路是,可以借助已处理的信息进行估计:,也可以利用当前信息估计:,一种折中的思路是二者的权衡:

  E-扩展谱减法

 上面的算法都需要借助VAD技术/噪声估计技术,实际上 维纳+谱减 的结合,可以实现降噪并称该方法:扩展谱减法。

维纳滤波原理

其中y为带噪信号,x为clean,n为noise.对于也就是

细节处理上可以用一下平滑

利用估计的噪声谱得出当前的噪声谱

从而估计当前的信号

它是自适应的,不需要估计噪声,因此对于非平稳噪声环境也同样适用。实现框图:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/242996.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Chapter 7:Statistical-Model-Based Methods

作者&#xff1a;桂。 时间&#xff1a;2017-05-25 10:14:21 主要是《Speech enhancement: theory and practice》的读书笔记&#xff0c;全部内容可以点击这里。 书中代码&#xff1a;http://pan.baidu.com/s/1hsj4Wlu&#xff0c;提取密码&#xff1a;9dmi 前言 最近学习有一…

使用握手信号实现跨时钟域数据传输

使用握手信号实现跨时钟域数据传输 题目描述 分别编写一个数据发送模块和一个数据接收模块,模块的时钟信号分别为clk_a,clk_b。两个时钟的频率不相同。数据发送模块循环发送0-7,在每个数据传输完成之后,间隔5个时钟,发送下一个数据。请在两个模块之间添加必要的握手信号,…

单边谱 → 双边谱

今天群里朋友问到一个问题&#xff1a;这个处理是啥意思&#xff1f; 记录一下。 思路&#xff1a; x为原信号&#xff0c;y为处理后的信号。其中大写为频域信号&#xff0c;小写为时域信号。 考虑到余弦对应的傅里叶变换&#xff0c;以及正弦对应的傅里叶变换&#xff0c;可以…

音频变调技术

今天看到群里有人讨论这个问题&#xff0c;记录一下。 主要内容转自&#xff1a;http://www.cnblogs.com/welen/p/3782896.html 变调和变速原理 自然语音的产生可以简化为图2-1模型&#xff0c;激励源出来的声门波信号与声道模型进行卷积&#xff0c;最后通过嘴唇辐射模型产生语…

SystemVerilog笔记

SystemVerilog笔记 使用&#xff08;$isunknown&#xff09;操作符&#xff0c;可以在表达式的任意位出现X或Z时返回1。$size函数返回数组的宽度关联数组switch&#xff0c;以实现从字符串到数字的映射。函数exists()来检查元素是否存在。方法unique返回的是在数组中具有唯一值…

收入和贷款有什么关系?

说到贷款&#xff0c;收入是至关重要的一环&#xff0c;收入在贷款审核过程中有着举足轻重的作用。那么具体来说&#xff0c;贷款到底和收入有什么关系呢&#xff1f;贷款审核考察借款人的收入目的是为了核实借款人的偿还能力&#xff0c;因此贷款机构不仅要考核借款人的收入&a…

银行系普惠和小贷系普惠,哪个贷款更靠谱?

2017年5月26日银监会发布了《大中型商业银行设立普惠金融事业部实施方案》&#xff0c;《实施方案》明确了大中型商业银行设立普惠金融事业部的总体目标&#xff0c;通过建立适应普惠金融服务需要的事业部管理体制&#xff0c;构建科学的治理机制和组织架构&#xff0c;健全专业…

并串 转换

并串 转换 题目描述 设计一个模块进行并串转换,要求每四位d输为转到一位dout输出,输出valid_in表示此时的输入有效 输入描述: clk为时钟 rst为低电平复位 d 信号输入 输出描述: dout 信号输出 valid_in 表示输入有效 题目解读 串并转换操作是非常灵活的操作,核心思想就…

H.264码流解析 一个SPS的nalu及获取视频的分辨率

00 00 00 01 67 42 00 28 E9 00 A0 0B 77 FE 00 02 00 03 C4 80 00 00 03 00 80 00 00 1A 4D 88 10 94 00 00 00 01 00 00 00 01为NALu头&#xff0c;‍其余码流由十六进制转为二进制 67 0110 0111 42 0100 0010 00 0000 0000 28 0010 1000 E9 1110 1001 00 0000 0000 A…

小额贷款利息违法吗?

我们经常听到很多朋友说&#xff0c;小额贷款利息高&#xff0c;认为小额贷款的利息是高利贷&#xff0c;不合法。那到底小额贷款算不算高利贷呢&#xff0c;是不是合法的呢&#xff1f;在解释这个问题之前&#xff0c;我们先来看下国家法律对合法利息的定义。《最高人民法院关…

什么样的征信才算是好的?

有过贷款的朋友都知道征信报告对贷款有很大的影响&#xff0c;有时候贷款的前期工作都准备好了&#xff0c;突然发现征信有问题&#xff0c;结果贷款就黄了。可见征信报告对贷款的作用还是很大的&#xff0c;贷款机构之所以会看重征信记录&#xff0c;因为它是一个人过去信用的…

时钟 切换

时钟 切换 题目描述 存在两个同步的倍频时钟clk0 clk1,已知clk0是clk1的二倍频,现在要设计一个切换电路,sel选择时候进行切换,要求没有毛刺。 信号示意图 题目解读 通过在每个时钟源的选择路径中插入一个负边沿触发的D触发器,可以确保时钟在高电平时,输出保持不变。 通…

动态时间规整-DTW算法

作者&#xff1a;桂。 时间&#xff1a;2017-05-31 16:17:29 链接&#xff1a;http://www.cnblogs.com/xingshansi/p/6924911.html 前言 动态时间规整&#xff08;Dynamic Time Warping&#xff0c;DTW&#xff09;是孤立词识别的早期技术&#xff0c;梳理一下&#xff0c;主…

到底逾期几次才会影响贷款申请?

大家都知道&#xff0c;申请贷款时&#xff0c;贷款机构会重点考察借款人的征信记录&#xff0c;那么&#xff0c;评估标准是什么呢&#xff1f;到底逾期几次才会影响到贷款的申请&#xff1f;在信贷行业&#xff0c;对逾期标准的评判一般是按“连三累六”的原则&#xff0c;简…

状态机与时钟分频

状态机与时钟分频 题目描述 使用状态机实现时钟分频,要求对时钟进行四分频,占空比为0.25 信号示意图 题目解读 首先考虑输入输出,作为分频电路,有一个时钟输入端,clk,输出端div3,再加一个复位端(这里不加也可)所以输入 clk,rst输出 clk_out再考虑状态转换的问题。4分…

candence 16.6 win8.1 x64 破解

测试机系统截图&#xff1a; 破解说明具体的步骤&#xff1a; 1、安装licensemanager&#xff0c;问license时&#xff0c;单击cancel&#xff0c;然后finish. 2、接下来安装cadence的product,即第二项,直到结束. 2.1 安装cadence16.6最新补丁Hotfix_SPB16.60.003_wint_1of1.ex…

矢量量化(VQ)

作者&#xff1a;桂。 时间&#xff1a;2017-05-31 21:14:56 链接&#xff1a;http://www.cnblogs.com/xingshansi/p/6925955.html 前言 VQ&#xff08;Vector Quantization&#xff09;是一个常用的压缩技术&#xff0c;本文主要回顾&#xff1a; 1&#xff09;VQ原理 2&am…

超前进位加法器

超前进位加法器 题目描述 求两个四位的数据编写一个四位的超前进位加法器,建议使用子模块 提示:超前进位加法器的位公式如下 这里‘+’ ‘’符号不是‘加’和‘乘’,是‘或’和 ‘与’ 题目解析 题目要求 4级可以表示为如下,这里P和G是传播信号和生成信号: `timesc…

哪些职业申请贷款比较难?

贷款一般会重点考核借款人的收入&#xff0c;信用&#xff0c;资产&#xff0c; 工作等基本信息&#xff0c;有时候明明借款人有着较高的收入&#xff0c;信用也良好&#xff0c;可是最后还是被拒绝了。这其中有很大一部分是跟借款人的职业有一定的关系。那到底哪些职业的人贷款…

常用音频软件:Wavesufer

作者&#xff1a;桂。 时间&#xff1a;2017-06-02 10:23:39 链接&#xff1a;http://www.cnblogs.com/xingshansi/p/6932408.html 前言 只列举两个自己用过的&#xff08;wavesufer和praat&#xff09;&#xff0c;如果有其他更好的软件&#xff0c;还希望各位留下链接。 本…