Python音频信号处理 2.使用谱减法去除音频底噪

使用谱减法去除音频底噪

上一篇文章我主要分享了短时傅立叶变换及其逆变换在python中的实现,有兴趣的可以阅读一下该篇文章,地址如下:
Python音频信号处理 1.短时傅里叶变换及其逆变换

那么在本篇文章中,我们将利用短时傅立叶变换及其逆变换来实现谱减法。

Part 1 :谱减法

谱减法的核心思路非常简单,顾名思义,谱减法是一种频域上的信号处理方法,其基本思路就是提取出信号本身的频谱以及噪音的频谱,通过两者之差获取降噪后信号的频谱,最后利用傅立叶变换逆变换重构初始信号。

Part 2 :使用谱减法降低或消除信号的底噪

要使用谱减法来进行信号处理,显然我们首先需要计算出信号的频谱以及噪音的频谱。这里我们继续使用上篇文章所介绍的短时傅立叶变换及其逆变换的实现,Python代码如下:

# 短时傅立叶变换
def TFCT(trame, Fe, Nfft,fenetre,Nwin,Nhop):L = round((len(trame) - len(fenetre))/Nhop)+1M = Nfftxmat = np.zeros((M,L))print('xmat',xmat.shape)print(Nwin+Nhop)for j in range(L):xmat[:,j] = np.fft.fft(trame[j*Nhop:Nwin+Nhop*j]*window,Nfft)  x_temporel = np.linspace(0,(1/Fe)*len(trame),len(trame))x_frequentiel = np.linspace(0, Fe,Nfft)return xmat,x_temporel,x_frequentiel
# 短时傅立叶变换逆变换
def ITFD(xmat,Fe,Nfft,Nwin,Nhop):window = np.hamming(Nwin)Te = 1/Feyvect = np.zeros(Nfft + (xmat.shape[1]-1)*Nhop)t_vecteur = np.arange(0,Te*len(yvect),Te)index = 0K = 0L = xmat.shape[1]yl = np.zeros((Nfft,L))for j in range(L):yl[:,j] = np.fft.ifft(xmat[:,j])for k in range(L):yvect[Nhop*k:Nfft+Nhop*k] += yl[:,k]for n in range(Nwin-1):K +=  window[n]K /= Nhopyvect /=Kprint(yvect.shape)return t_vecteur, yvect

有关于短时傅立叶变换及其逆变换的实现这里就不过多赘述,有兴趣的可以参考上一篇文章,其中详细解释了代码的构成。

首先我们先读取信号,并观察其在时域中的图像:

# 读取初始信号 mix.wav
Fe, mix = wavfile.read('mix.wav')
mix = mix/2**15
Te = 1 / Fe
xtemp = np.arange(0,Te*len(mix),Te)
plt.figure()
plt.plot(xtemp,mix)
plt.axis([0,1,-0.6,0.6])
plt.xlabel('t(s)')
plt.ylabel('amplitude(V)')
plt.title('representation of the original signal in time domain')
display(Audio(mix,rate=Fe))

Fe为原始信号的采样频率,mix为复信号值。
Te = 1/Fe = 6.25e-5
在这里插入图片描述
我们不难发现,0-0.4s,时域上只有底噪,因此我们可以利用这段时间来计算噪音的频谱。
这个例子中,我们选择频域的采样点个数Nfft=1024,窗函数的长度Nwin=1024,每次窗函数滑动的长度Nhop=512,计算该信号的短时傅立叶变换。

Nfft = 1024
Nwin = 1024
Nhop = 512
window = np.hamming(Nwin)
xmat_sound,tvect,fvect = TFCT(mix,Fe,Nfft,window,Nwin,Nhop)

xmat_sound就是我们保存短时傅立叶变换值的矩阵,该矩阵的每一行代表一个在0至采样频率范围内的频率,单位为Hz,每一列对应该段被窗函数截取的信号的FFT快速傅里叶变换值。
不难算出第一列代表的时域范围为0-Nwin*(1/Fe)= 0.064s
在该例中,我们就使用第一列的频谱,近似认为是底噪的频谱。(显然我们这里应该取尽可能多的纯噪音频谱,并使用他们幅值的平均值,这里为了简化仅使用第一个窗函数截取的信号部分作为噪声频谱。)

我们可以先使用imshow画出原始信号的光谱图,横轴为时间,纵轴为频率。

module_tf_xmat = abs(xmat_sound)
plt.figure()
xlim = int(module_tf_xmat.shape[0]/2)
ylim = int(module_tf_xmat.shape[1]/2)
plt.imshow(20*np.log10(module_tf_xmat[0:xlim,:]),extent=[0,Te*len(mix),0,Fe/2],aspect='auto')
plt.colorbar()
plt.xlabel('time(s)')
plt.ylabel('frequence(Hz)')
plt.title('spectrogram of the originql signal')

在这里插入图片描述
接下来我们使用谱减法,对信号频谱所有列减去第一列对应的噪音频谱,注意这里的全部减法都是针对幅值。

module_tf_xmat = abs(xmat_sound)
angle_tf_xmat = np.angle(xmat_sound)
module_tf_bruit = module_tf_xmat[:,0]module_reconstruit = np.zeros(module_tf_xmat.shape)
for n in range(module_tf_xmat.shape[1]):module_reconstruit[:,n] = module_tf_xmat[:,n] - module_tf_bruit
module_reconstruit[module_reconstruit<0] = 0

谱减法之后的光谱图如下所示:
在这里插入图片描述
最后我们使用短时傅立叶变换逆变换将获取的降噪后的幅值矩阵,使用原始的信号相位,重构降噪后的复信号。

# 将相位和降噪后的幅值重构复信号的频域分布
tf_reconstruit = np.zeros(module_tf_xmat.shape,dtype=complex)
for i in range(module_tf_xmat.shape[0]):for j in range(module_tf_xmat.shape[1]):tf_reconstruit[i,j] = module_reconstruit[i,j] * np.exp(angle_tf_xmat[i,j]*1j)
# 使用短时傅立叶变换逆变换重构时域内的信号
t,yvect = ITFD(tf_reconstruit,Fe,Nfft,Nwin,Nhop)

总结

在本例中,我们仅仅使用了短时傅立叶变换矩阵的第一列来计算噪声的频谱,实际是非常不准确的,因为此时所取的噪声长度仅为0.064s。即使是对于平稳的噪音,这段噪声的频谱仍然不能很好地代表噪音的真实频谱。在实际的信号处理过程中,较好的方式是取足够长度的噪音并计算其幅值的平均值,再使用这个噪音在各个频率幅值的平均值进行谱减法,可以更加有效地降低底噪。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/387006.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

线程池的优点

线程池的优点 1、线程是稀缺资源&#xff0c;使用线程池可以减少创建和销毁线程的次数&#xff0c;每个工作线程都可以重复使用。 2、可以根据系统的承受能力&#xff0c;调整线程池中工作线程的数量&#xff0c;防止因为消耗过多内存导致服务器崩溃。 线程池的创建 public…

ROS(Robot Operating System)笔记 : 2.创建并配置package

ROS(Robot Operating System)笔记 : 2.创建一个ROS包并设置其依赖 1.首先来到ros的工作目录下&#xff0c;接着使用 catkin_make [包名称] [依赖1] [依赖2] … 创建一个包名为 challenge_project 的 ros包。 $ catkin_create_pkg challenge_project rospy std_msgs cv_bri…

Java线程相关的热门面试题

1) 什么是线程&#xff1f; 线程是操作系统能够进行运算调度的最小单位&#xff0c;它被包含在进程之中&#xff0c;是进程中的实际运作单位。程序员可以通过它进行多处理器编程&#xff0c;你可以使用多线程对运算密集型任务提速。比如&#xff0c;如果一个线程完成一个任务要…

linux运维、架构之路-jumpserver

linux运维、架构之路-jumpserver 一、jumpserver介绍 是一款由python编写开源的跳板机(堡垒机)系统&#xff0c;实现了跳板机应有的功能。基于ssh协议来管理&#xff0c;客户端无需安装agent。 特点&#xff1a; 完全开源&#xff0c;GPL授权 Python编写&#xff0c;容易再次开…

C++ STL学习笔记 : 1. template 模板函数

本篇文章是学习C STL库的第一篇笔记&#xff0c;主要记录了使用template关键字创建模板函数的方法。 下面用一个非常简单的例子解释模板函数的用法 : #include <iostream> using namespace std;template <class T> void myswap(T& a, T& b) {T temp a;a…

C++ STL学习笔记 : 2. unordered map 容器

本文中&#xff0c;简单总结一下使用unordered map 的心得。unordered_map容器属于STL中关联表的一种&#xff0c;常用的map容器与unordered_map容器在使用中有着很大程度的相同点&#xff0c;在之后的文章中我可能会针对二者的相同点与不同点进行细致的分析&#xff0c;这里就…

tensorflow 安装在Anaconda

python环境&#xff1a;win10 64下anaconda4.2.0(python3.5)。安装tensorflow过程是在Anaconda Prompt中进行安装 1&#xff1a;打开Anaconda Prompt 在安装之前&#xff0c;说几个关于conda的小命令 conda list&#xff1a;可以显示已经安装好的库。 conda install 库名 &…

伯努利数学习笔记的说...

经过一天的学习&#xff0c;我们发现伯努利数是个非常有用 &#xff08;个屁&#xff09; 的数列 定义 但是...伯努利数是什么呢&#xff1f;我们先给伯努利数一个定义&#xff1a; 令 \(B(i)\) 表示 伯努利数第 i 项&#xff0c;那么有&#xff1a; \[\sum_{i0}^{n} \begin{pm…

Dijkstra迪杰斯特拉算法 C++实现

本篇文章主要介绍了Dijkstra迪杰斯特拉算法的C实现&#xff0c;文章包含两个部分&#xff0c;在第一部分中我会简单介绍迪杰斯特拉算法以及一些个人的理解&#xff0c;第二部分会对C代码的逻辑进行解释。下面是我已经上传的代码资源&#xff0c;大家有兴趣的可以点击链接下载资…

Python开发一个股票类库

前言 使用Python开发一个股票项目。 项目地址&#xff1a; https://github.com/pythonstock/stock 相关资料&#xff1a; http://blog.csdn.net/freewebsys/article/details/78294566 主要使用开发语言是python。 使用的lib库是pandas&#xff0c;tushare&#xff0c;Tens…

LeetCode 105. Construct Binary Tree from Preorder and Inorder Traversal 由前序和中序遍历建立二叉树 C++...

LeetCode 105. Construct Binary Tree from Preorder and Inorder Traversal 由前序和中序遍历建立二叉树 C Given preorder and inorder traversal of a tree, construct the binary tree. Note:You may assume that duplicates do not exist in the tree. For example, given…

C++ STL 学习笔记 3. 文本文件操作

本文主要总结了C中对文本文件的基本操作以及使用心得&#xff0c;第一部分中总结了C对文本文件的基本操作&#xff0c;第二部分中会以csv文件为例&#xff0c;进行读取存储由逗号分隔的字符串的操作。 1. 文本读取写入基础 要使用文件输入输出流&#xff0c;首先需要include相…

C# 调用python

1.C# 调用python 本质上是使用命令行运行python 1.1 C# 使用命令行 program.cs using System; using System.Diagnostics; using System.IO;namespace test {class Program{static void Main(string[] args){Program p new Program();string result p.run_cmd("ping…

4-17

1、html 中div class是什么&#xff1f; 在这里我将用id与class的比较&#xff0c;让这个问题更容易理解&#xff08;1&#xff09;、使用区别id具有唯一性&#xff0c;在一个网页中同一个命名只能使用一次&#xff1b;class命名的类可以在一个网页中使用无数次。&#xff08;2…

python pandas serie简介及基本使用

本篇文章主要罗列了pandas模块中serie的基本使用。环境是jupyter notebook python 3.7。 serie是能够保存任何类型数据的一维数组&#xff0c;轴标签统称为索引&#xff0c;索引必须是唯一的散列且与数据的长度相同&#xff0c;默认情况下为np.arange(n)。 首先是import pand…

Linux系统中nc工具那些不为人知的用法

Linux nc命令用法 参考地址&#xff1a;https://www.cnblogs.com/jjzd/p/6306273.html -g<网关>&#xff1a;设置路由器跃程通信网关&#xff0c;最多设置8个; -G<指向器数目>&#xff1a;设置来源路由指向器&#xff0c;其数值为4的倍数; -h&#xff1a;在线帮助;…

python pandas dataframe基本使用整理

dataframe是一种表格型的数据存储结构&#xff0c;可以看作是几个serie的集合。dataframe既有行索引&#xff0c;也有列索引。 以下代码环境为google colab/jupyter notebook。 接下来就对dataframe的基本使用进行整理。 dataframe也从属于pandas模块&#xff0c;因此还是老规矩…

常见开源分布式存储系统

对比说明 /文件系统 TFS FastDFS MogileFS MooseFS GlusterFS Ceph 开发语言 C C Perl C C C 开源协议 GPL V2 GPL V3 GPL GPL V3 GPL V3 LGPL 数据存储方式 块 文件/Trunk 文件 块 文件/块 对象/文件/块 集群节点通信协议 私有协议&#xff08;T…

[十二省联考2019]皮配

题目链接 选一个派系和一个阵营可以唯一确定一名导师 因为每一个阵营里的导师都分别来自不同派系&#xff0c;所以k0时&#xff0c;对阵营的选择是不影响对派系的选择的 唯一的限制就是同城市的要在同一个阵营 所以以每个城市为物品&#xff0c;物品大小为该城市的人数&#xf…

机器学习理论梳理1: PCA主成分分析

机器学习的理论部分学习知识点比较乱且杂。我这里通过几篇文章&#xff0c;简单总结一下自己对机器学习理论的理解&#xff0c;以防遗忘。第一篇文章主要概述了机器学习的基本任务以及一个常用的降维方法&#xff0c;主成分分析。 机器学习的基本任务 机器学习能实现许多不同…