Python音频信号处理 2.使用谱减法去除音频底噪

使用谱减法去除音频底噪

上一篇文章我主要分享了短时傅立叶变换及其逆变换在python中的实现,有兴趣的可以阅读一下该篇文章,地址如下:
Python音频信号处理 1.短时傅里叶变换及其逆变换

那么在本篇文章中,我们将利用短时傅立叶变换及其逆变换来实现谱减法。

Part 1 :谱减法

谱减法的核心思路非常简单,顾名思义,谱减法是一种频域上的信号处理方法,其基本思路就是提取出信号本身的频谱以及噪音的频谱,通过两者之差获取降噪后信号的频谱,最后利用傅立叶变换逆变换重构初始信号。

Part 2 :使用谱减法降低或消除信号的底噪

要使用谱减法来进行信号处理,显然我们首先需要计算出信号的频谱以及噪音的频谱。这里我们继续使用上篇文章所介绍的短时傅立叶变换及其逆变换的实现,Python代码如下:

# 短时傅立叶变换
def TFCT(trame, Fe, Nfft,fenetre,Nwin,Nhop):L = round((len(trame) - len(fenetre))/Nhop)+1M = Nfftxmat = np.zeros((M,L))print('xmat',xmat.shape)print(Nwin+Nhop)for j in range(L):xmat[:,j] = np.fft.fft(trame[j*Nhop:Nwin+Nhop*j]*window,Nfft)  x_temporel = np.linspace(0,(1/Fe)*len(trame),len(trame))x_frequentiel = np.linspace(0, Fe,Nfft)return xmat,x_temporel,x_frequentiel
# 短时傅立叶变换逆变换
def ITFD(xmat,Fe,Nfft,Nwin,Nhop):window = np.hamming(Nwin)Te = 1/Feyvect = np.zeros(Nfft + (xmat.shape[1]-1)*Nhop)t_vecteur = np.arange(0,Te*len(yvect),Te)index = 0K = 0L = xmat.shape[1]yl = np.zeros((Nfft,L))for j in range(L):yl[:,j] = np.fft.ifft(xmat[:,j])for k in range(L):yvect[Nhop*k:Nfft+Nhop*k] += yl[:,k]for n in range(Nwin-1):K +=  window[n]K /= Nhopyvect /=Kprint(yvect.shape)return t_vecteur, yvect

有关于短时傅立叶变换及其逆变换的实现这里就不过多赘述,有兴趣的可以参考上一篇文章,其中详细解释了代码的构成。

首先我们先读取信号,并观察其在时域中的图像:

# 读取初始信号 mix.wav
Fe, mix = wavfile.read('mix.wav')
mix = mix/2**15
Te = 1 / Fe
xtemp = np.arange(0,Te*len(mix),Te)
plt.figure()
plt.plot(xtemp,mix)
plt.axis([0,1,-0.6,0.6])
plt.xlabel('t(s)')
plt.ylabel('amplitude(V)')
plt.title('representation of the original signal in time domain')
display(Audio(mix,rate=Fe))

Fe为原始信号的采样频率,mix为复信号值。
Te = 1/Fe = 6.25e-5
在这里插入图片描述
我们不难发现,0-0.4s,时域上只有底噪,因此我们可以利用这段时间来计算噪音的频谱。
这个例子中,我们选择频域的采样点个数Nfft=1024,窗函数的长度Nwin=1024,每次窗函数滑动的长度Nhop=512,计算该信号的短时傅立叶变换。

Nfft = 1024
Nwin = 1024
Nhop = 512
window = np.hamming(Nwin)
xmat_sound,tvect,fvect = TFCT(mix,Fe,Nfft,window,Nwin,Nhop)

xmat_sound就是我们保存短时傅立叶变换值的矩阵,该矩阵的每一行代表一个在0至采样频率范围内的频率,单位为Hz,每一列对应该段被窗函数截取的信号的FFT快速傅里叶变换值。
不难算出第一列代表的时域范围为0-Nwin*(1/Fe)= 0.064s
在该例中,我们就使用第一列的频谱,近似认为是底噪的频谱。(显然我们这里应该取尽可能多的纯噪音频谱,并使用他们幅值的平均值,这里为了简化仅使用第一个窗函数截取的信号部分作为噪声频谱。)

我们可以先使用imshow画出原始信号的光谱图,横轴为时间,纵轴为频率。

module_tf_xmat = abs(xmat_sound)
plt.figure()
xlim = int(module_tf_xmat.shape[0]/2)
ylim = int(module_tf_xmat.shape[1]/2)
plt.imshow(20*np.log10(module_tf_xmat[0:xlim,:]),extent=[0,Te*len(mix),0,Fe/2],aspect='auto')
plt.colorbar()
plt.xlabel('time(s)')
plt.ylabel('frequence(Hz)')
plt.title('spectrogram of the originql signal')

在这里插入图片描述
接下来我们使用谱减法,对信号频谱所有列减去第一列对应的噪音频谱,注意这里的全部减法都是针对幅值。

module_tf_xmat = abs(xmat_sound)
angle_tf_xmat = np.angle(xmat_sound)
module_tf_bruit = module_tf_xmat[:,0]module_reconstruit = np.zeros(module_tf_xmat.shape)
for n in range(module_tf_xmat.shape[1]):module_reconstruit[:,n] = module_tf_xmat[:,n] - module_tf_bruit
module_reconstruit[module_reconstruit<0] = 0

谱减法之后的光谱图如下所示:
在这里插入图片描述
最后我们使用短时傅立叶变换逆变换将获取的降噪后的幅值矩阵,使用原始的信号相位,重构降噪后的复信号。

# 将相位和降噪后的幅值重构复信号的频域分布
tf_reconstruit = np.zeros(module_tf_xmat.shape,dtype=complex)
for i in range(module_tf_xmat.shape[0]):for j in range(module_tf_xmat.shape[1]):tf_reconstruit[i,j] = module_reconstruit[i,j] * np.exp(angle_tf_xmat[i,j]*1j)
# 使用短时傅立叶变换逆变换重构时域内的信号
t,yvect = ITFD(tf_reconstruit,Fe,Nfft,Nwin,Nhop)

总结

在本例中,我们仅仅使用了短时傅立叶变换矩阵的第一列来计算噪声的频谱,实际是非常不准确的,因为此时所取的噪声长度仅为0.064s。即使是对于平稳的噪音,这段噪声的频谱仍然不能很好地代表噪音的真实频谱。在实际的信号处理过程中,较好的方式是取足够长度的噪音并计算其幅值的平均值,再使用这个噪音在各个频率幅值的平均值进行谱减法,可以更加有效地降低底噪。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/387006.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

线程池的优点

线程池的优点 1、线程是稀缺资源&#xff0c;使用线程池可以减少创建和销毁线程的次数&#xff0c;每个工作线程都可以重复使用。 2、可以根据系统的承受能力&#xff0c;调整线程池中工作线程的数量&#xff0c;防止因为消耗过多内存导致服务器崩溃。 线程池的创建 public…

linux运维、架构之路-jumpserver

linux运维、架构之路-jumpserver 一、jumpserver介绍 是一款由python编写开源的跳板机(堡垒机)系统&#xff0c;实现了跳板机应有的功能。基于ssh协议来管理&#xff0c;客户端无需安装agent。 特点&#xff1a; 完全开源&#xff0c;GPL授权 Python编写&#xff0c;容易再次开…

C++ STL学习笔记 : 1. template 模板函数

本篇文章是学习C STL库的第一篇笔记&#xff0c;主要记录了使用template关键字创建模板函数的方法。 下面用一个非常简单的例子解释模板函数的用法 : #include <iostream> using namespace std;template <class T> void myswap(T& a, T& b) {T temp a;a…

C++ STL学习笔记 : 2. unordered map 容器

本文中&#xff0c;简单总结一下使用unordered map 的心得。unordered_map容器属于STL中关联表的一种&#xff0c;常用的map容器与unordered_map容器在使用中有着很大程度的相同点&#xff0c;在之后的文章中我可能会针对二者的相同点与不同点进行细致的分析&#xff0c;这里就…

tensorflow 安装在Anaconda

python环境&#xff1a;win10 64下anaconda4.2.0(python3.5)。安装tensorflow过程是在Anaconda Prompt中进行安装 1&#xff1a;打开Anaconda Prompt 在安装之前&#xff0c;说几个关于conda的小命令 conda list&#xff1a;可以显示已经安装好的库。 conda install 库名 &…

Dijkstra迪杰斯特拉算法 C++实现

本篇文章主要介绍了Dijkstra迪杰斯特拉算法的C实现&#xff0c;文章包含两个部分&#xff0c;在第一部分中我会简单介绍迪杰斯特拉算法以及一些个人的理解&#xff0c;第二部分会对C代码的逻辑进行解释。下面是我已经上传的代码资源&#xff0c;大家有兴趣的可以点击链接下载资…

Python开发一个股票类库

前言 使用Python开发一个股票项目。 项目地址&#xff1a; https://github.com/pythonstock/stock 相关资料&#xff1a; http://blog.csdn.net/freewebsys/article/details/78294566 主要使用开发语言是python。 使用的lib库是pandas&#xff0c;tushare&#xff0c;Tens…

C++ STL 学习笔记 3. 文本文件操作

本文主要总结了C中对文本文件的基本操作以及使用心得&#xff0c;第一部分中总结了C对文本文件的基本操作&#xff0c;第二部分中会以csv文件为例&#xff0c;进行读取存储由逗号分隔的字符串的操作。 1. 文本读取写入基础 要使用文件输入输出流&#xff0c;首先需要include相…

C# 调用python

1.C# 调用python 本质上是使用命令行运行python 1.1 C# 使用命令行 program.cs using System; using System.Diagnostics; using System.IO;namespace test {class Program{static void Main(string[] args){Program p new Program();string result p.run_cmd("ping…

python pandas serie简介及基本使用

本篇文章主要罗列了pandas模块中serie的基本使用。环境是jupyter notebook python 3.7。 serie是能够保存任何类型数据的一维数组&#xff0c;轴标签统称为索引&#xff0c;索引必须是唯一的散列且与数据的长度相同&#xff0c;默认情况下为np.arange(n)。 首先是import pand…

python pandas dataframe基本使用整理

dataframe是一种表格型的数据存储结构&#xff0c;可以看作是几个serie的集合。dataframe既有行索引&#xff0c;也有列索引。 以下代码环境为google colab/jupyter notebook。 接下来就对dataframe的基本使用进行整理。 dataframe也从属于pandas模块&#xff0c;因此还是老规矩…

常见开源分布式存储系统

对比说明 /文件系统 TFS FastDFS MogileFS MooseFS GlusterFS Ceph 开发语言 C C Perl C C C 开源协议 GPL V2 GPL V3 GPL GPL V3 GPL V3 LGPL 数据存储方式 块 文件/Trunk 文件 块 文件/块 对象/文件/块 集群节点通信协议 私有协议&#xff08;T…

机器学习理论梳理1: PCA主成分分析

机器学习的理论部分学习知识点比较乱且杂。我这里通过几篇文章&#xff0c;简单总结一下自己对机器学习理论的理解&#xff0c;以防遗忘。第一篇文章主要概述了机器学习的基本任务以及一个常用的降维方法&#xff0c;主成分分析。 机器学习的基本任务 机器学习能实现许多不同…

NLP基础 : HMM 隐马尔可夫模型

Hidden Markov Model, HMM 隐马尔可夫模型&#xff0c;是一种描述隐性变量(状态)和显性变量(观测状态)之间关系的模型。该模型遵循两个假设&#xff0c;隐性状态i只取决于前一个隐性状态i-1&#xff0c;而与其他先前的隐形状态无关。观测状态也只取决于当前的隐形状态。因此我们…

关于秒杀系统优化方向

今天听了一节咕泡学院的公开课&#xff0c;有收获。 秒杀系统的特点&#xff1a; 1.限时&#xff1b;2.限量供应&#xff1b;3.并发量大&#xff1b;如何优化&#xff1a; 1.客户端数据缓存。 2.CDN加速。 3.nginx动静分离&#xff0c;静态资源缓存&#xff0c;负载均衡。 4.se…

RUNOOB python练习题1

用来练手的python 练习题&#xff0c;原链接 : python练习实例1 题干 : 有四个数字&#xff1a;1、2、3、4&#xff0c;能组成多少个互不相同且无重复数字的三位数&#xff1f;各是多少&#xff1f; import numpy as np cen np.array([1,2,3,4]) tens np.array([1,2,3,4])…

MySQL 亿级数据需求的优化思路(一),交易流水记录的查询

对MySQL的性能和亿级数据的处理方法思考&#xff0c;以及分库分表到底该如何做&#xff0c;在什么场景比较合适&#xff1f; 比如银行交易流水记录的查询 限盐少许&#xff0c;上实际实验过程&#xff0c;以下是在实验的过程中做一些操作&#xff0c;以及踩过的一些坑&#…

RUNOOB python练习题2

用来练手的python 练习题&#xff0c;原链接 : python练习实例2 题干 : 企业发放的奖金根据利润提成。利润(I)低于或等于10万元时&#xff0c;奖金可提10%&#xff1b;利润高于10万元&#xff0c;低于20万元时&#xff0c;低于10万元的部分按10%提成&#xff0c;高于10万元的…

MySQL 亿级数据需求的优化思路(二),100亿数据,1万字段属性的秒级检索

最近在研究亿级数据的时候&#xff0c;无意中看到了一个关于写58同城的文章 https://blog.csdn.net/admin1973/article/details/55251499?fromtimeline 其实上面讲的versionext的方式以及压缩json的思路&#xff0c;对于我来讲都可以看得懂&#xff0c;想得通&#xff0c;其…

RUNOOB python练习题3

用来练手的python 练习题&#xff0c;原链接 : python练习实例3 拿到题目就写了如下代码&#xff0c;思路是因为使用**0.5进行开平方操作时&#xff0c;python会将数据类型自动转换为float单精度浮点型。这里利用提取其整数部分&#xff0c;来判断这个数是否是完全平方数。 z…