Python音频信号处理 1.短时傅里叶变换及其逆变换

短时傅里叶变换及其逆变换

本篇文章主要记录了使用python进行短时傅里叶变换,分析频谱,以及通过频谱实现在频域内降低底噪的代码及分析,希望可以给同样在学习信号处理的大家一点帮助,也希望大家对我的文章多提意见建议。

一. 短时傅里叶变换与离散傅里叶变换

在这篇文章中我们主要运用了短时傅里叶变换,要想清楚地理解短时傅里叶变换,首先必须要了解离散傅里叶变换(Discrete Fourier Transform,DFT)。

1.离散傅里叶变换

离散傅里叶的定义:
∀k∈[0,M−1],X[k]=∑n=0N−1x[n]e−2jπnfkFe=∑n=0N−1x[n]e−2jπnkFeMFe\\{\forall} k\in [0,M-1] ,X[k]=\sum^{N-1}_{n=0}x[n] e^{-\cfrac{2j\pi nf_k} {F_e}} = \sum^{N-1}_{n=0}x[n]e^{-\cfrac{2j\pi nk\frac{F_e}{M}}{Fe}} k[0,M1],X[k]=n=0N1x[n]eFe2jπnfk=n=0N1x[n]eFe2jπnkMFe
=∑n=0N−1x[n]e−2jπknM\qquad \qquad \qquad \qquad = \sum^{N-1}_{n=0}x[n]e^{-\cfrac{2j\pi kn}{M}}=n=0N1x[n]eM2jπkn

离散傅里叶变换适用于在时域上不连续且有限的数字信号,在上述公式中,x[n] 就是我们在时域中的初始数字信号,Fe 对应这个信号的采样频率。在离散傅里叶变换中,首先初始数字信号本身是离散的,在上式中初始信号x[n]是在时域内的一段有限信号,N代表了该段数字信号一共包含N个采样点,即其在时域上的长度为1/Fe * N。同时离散傅里叶变换所得的结果X[k]在频域上也是离散的,简而言之,是将频域[0,Fe]等分成了M份 :
在这里插入图片描述
X[k]也可以理解为包含了M个复数值的向量。在离散傅里叶变换中,采样点的个数N(时域上的取样长度),以及频域上的采样个数M都是可调整的,两个采样个数的选择对于DFT的解析度和精确度会有影响,这里就不过多展开。

我们在实际应用离散傅里叶变换时,会发现,有的时域上完全不同的信号,他们的离散傅里叶变换频谱却是一致的,因此我们引入一个新的 短时傅里叶变换(STFT)。

2.短时傅里叶变换

短时傅里叶变换的定义 :

X(τ,f)=∫Rx(t)h∗(t−τ)e−2jπftdtX(\tau,f)=\int_Rx(t)h^*(t-\tau)e^{-2j\pi ft}dtX(τ,f)=Rx(t)h(tτ)e2jπftdt

其中,h∗(t−τ)\ h^*(t-\tau) h(tτ) 是一个中心为τ\tauτ的窗函数

当引入了时间变量τ\tauτ之后我们就可以针对不同瞬间进行频谱分析,对于每一个瞬间τ\tauτ我们都可以获取信号在该时刻的频谱。

二. 使用python 进行短时傅里叶变换

在这一部分我会分享基于python的短时傅里叶变换的实现,可供参考。
首先是可能使用到的python库

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from IPython.display import display, Audio
from numpy import log10

接下来就是短时傅里叶变换的python实现

def TFCT(trame, Fe, Nfft,fenetre,Nwin,Nhop):L = round((len(trame) - len(fenetre))/Nhop)+1M = Nfftxmat = np.zeros((M,L))print('xmat',xmat.shape)print(Nwin+Nhop)for j in range(L):xmat[:,j] = np.fft.fft(trame[j*Nhop:Nwin+Nhop*j]*fenetre,Nfft)  x_temporel = np.linspace(0,(1/Fe)*len(trame),len(trame))x_frequentiel = np.linspace(0, Fe,Nfft)return xmat,x_temporel,x_frequentiel

上述函数解释:
参数部分
trameFe : 初始的数字信号和它的采样频率
Nfft : 上文提到的离散傅里叶变换中,频域的采样个数M
fenetre : 短时傅里叶变换中使用的窗函数,在接下来的实现中我都使用了汉明窗np.hamming。
Nwin : 窗函数的长度(包含点的个数)
Nhop : 窗函数每次滑动的长度,一般规定为Nwin/2,窗函数长度的一半

首先创建一个M行L列的矩阵xmat,该矩阵的每一行代表一个0-Fe的频率,单位为Hz,每一列对应该段被窗函数截取的信号的FFT快速傅里叶变换。

三. 使用overlapp-add算法进行短时傅里叶变换的逆变换重构原信号

在这一部分中,我们使用了overlapp-add算法来进行短时傅里叶变换的逆变换。
下面是该部分的全部代码,之后会逐步解释算法的实现 :

def ITFD(xmat,Fe,Nfft,Nwin,Nhop):window = np.hamming(Nwin)Te = 1/Feyvect = np.zeros(Nfft + (xmat.shape[1]-1)*Nhop,dtype=complex)t_vecteur = np.arange(0,Te*len(yvect),Te)index = 0K = 0L = xmat.shape[1]yl = np.zeros(xmat.shape,dtype=complex)for j in range(L):yl[:,j] = np.fft.ifft(xmat[:,j])# 平移和求和for k in range(L):yvect[Nhop*k:Nfft+Nhop*k] += yl[:,k]# 标准化幅值for n in range(Nwin-1):K +=  window[n]K /= Nhopyvect /=Kreturn t_vecteur, yvect

该算法的实现需要三步。

1. 快速傅里叶逆变换

yl = np.zeros(xmat.shape,dtype=complex)
for j in range(L):yl[:,j] = np.fft.ifft(xmat[:,j])

第一步,对上一部分得出的矩阵xmat进行快速傅里叶变换的逆变换,得出同样规格M行L列的矩阵yl。

2. 对各列进行平移并叠加

 # 平移和求和for k in range(L):yvect[Nhop*k:Nfft+Nhop*k] += yl[:,k]

对yl矩阵的每一列平移 (l-1)Nhop,l ∈\in [1,L],例如第一列不变,第二列平移Nhop,第三列平移2Nhop,以此类推。之后将所有列的转置,叠加到总长度为Nfft +(L-1)*Nhop的向量yvect中。
在这里插入图片描述

3. 标准化

# 标准化幅值
for n in range(Nwin-1):K +=  window[n]K /= Nhopyvect /=K
return t_vecteur, yvect

window[n] (w[n]) 是长度为Nwin的窗函数,在选取窗函数的时候,我们总满足规则 K=∑l=1Lw[n−(l−1)Nhop]\ K=\sum^L_{l=1}w[n-(l-1)Nhop] K=l=1Lw[n(l1)Nhop] K的值与n无关。在此基础上不难证明
K≈∑n=0Nwin−1w[n]/Nhop\ K \approx \sum^{Nwin-1}_{n=0}w[n] / Nhop Kn=0Nwin1w[n]/Nhop

那么通过以上的三个步骤,我们就可以从信号的短时傅里叶变换矩阵中完美重构原信号了。
下一篇文章我们将使用这些算法,使用谱减法进行声音信号的降噪处理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/387009.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java多线程同步机制

一段synchronized的代码被一个线程执行之前,他要先拿到执行这段代码的权限,在 java里边就是拿到某个同步对象的锁(一个对象只有一把锁); 如果这个时候同步对象的锁被其他线程拿走了,他(这个线程…

Python音频信号处理 2.使用谱减法去除音频底噪

使用谱减法去除音频底噪 上一篇文章我主要分享了短时傅立叶变换及其逆变换在python中的实现,有兴趣的可以阅读一下该篇文章,地址如下: Python音频信号处理 1.短时傅里叶变换及其逆变换 那么在本篇文章中,我们将利用短时傅立叶变…

线程池的优点

线程池的优点 1、线程是稀缺资源,使用线程池可以减少创建和销毁线程的次数,每个工作线程都可以重复使用。 2、可以根据系统的承受能力,调整线程池中工作线程的数量,防止因为消耗过多内存导致服务器崩溃。 线程池的创建 public…

linux运维、架构之路-jumpserver

linux运维、架构之路-jumpserver 一、jumpserver介绍 是一款由python编写开源的跳板机(堡垒机)系统,实现了跳板机应有的功能。基于ssh协议来管理,客户端无需安装agent。 特点: 完全开源,GPL授权 Python编写,容易再次开…

C++ STL学习笔记 : 1. template 模板函数

本篇文章是学习C STL库的第一篇笔记&#xff0c;主要记录了使用template关键字创建模板函数的方法。 下面用一个非常简单的例子解释模板函数的用法 : #include <iostream> using namespace std;template <class T> void myswap(T& a, T& b) {T temp a;a…

C++ STL学习笔记 : 2. unordered map 容器

本文中&#xff0c;简单总结一下使用unordered map 的心得。unordered_map容器属于STL中关联表的一种&#xff0c;常用的map容器与unordered_map容器在使用中有着很大程度的相同点&#xff0c;在之后的文章中我可能会针对二者的相同点与不同点进行细致的分析&#xff0c;这里就…

tensorflow 安装在Anaconda

python环境&#xff1a;win10 64下anaconda4.2.0(python3.5)。安装tensorflow过程是在Anaconda Prompt中进行安装 1&#xff1a;打开Anaconda Prompt 在安装之前&#xff0c;说几个关于conda的小命令 conda list&#xff1a;可以显示已经安装好的库。 conda install 库名 &…

Dijkstra迪杰斯特拉算法 C++实现

本篇文章主要介绍了Dijkstra迪杰斯特拉算法的C实现&#xff0c;文章包含两个部分&#xff0c;在第一部分中我会简单介绍迪杰斯特拉算法以及一些个人的理解&#xff0c;第二部分会对C代码的逻辑进行解释。下面是我已经上传的代码资源&#xff0c;大家有兴趣的可以点击链接下载资…

Python开发一个股票类库

前言 使用Python开发一个股票项目。 项目地址&#xff1a; https://github.com/pythonstock/stock 相关资料&#xff1a; http://blog.csdn.net/freewebsys/article/details/78294566 主要使用开发语言是python。 使用的lib库是pandas&#xff0c;tushare&#xff0c;Tens…

C++ STL 学习笔记 3. 文本文件操作

本文主要总结了C中对文本文件的基本操作以及使用心得&#xff0c;第一部分中总结了C对文本文件的基本操作&#xff0c;第二部分中会以csv文件为例&#xff0c;进行读取存储由逗号分隔的字符串的操作。 1. 文本读取写入基础 要使用文件输入输出流&#xff0c;首先需要include相…

C# 调用python

1.C# 调用python 本质上是使用命令行运行python 1.1 C# 使用命令行 program.cs using System; using System.Diagnostics; using System.IO;namespace test {class Program{static void Main(string[] args){Program p new Program();string result p.run_cmd("ping…

python pandas serie简介及基本使用

本篇文章主要罗列了pandas模块中serie的基本使用。环境是jupyter notebook python 3.7。 serie是能够保存任何类型数据的一维数组&#xff0c;轴标签统称为索引&#xff0c;索引必须是唯一的散列且与数据的长度相同&#xff0c;默认情况下为np.arange(n)。 首先是import pand…

python pandas dataframe基本使用整理

dataframe是一种表格型的数据存储结构&#xff0c;可以看作是几个serie的集合。dataframe既有行索引&#xff0c;也有列索引。 以下代码环境为google colab/jupyter notebook。 接下来就对dataframe的基本使用进行整理。 dataframe也从属于pandas模块&#xff0c;因此还是老规矩…

常见开源分布式存储系统

对比说明 /文件系统 TFS FastDFS MogileFS MooseFS GlusterFS Ceph 开发语言 C C Perl C C C 开源协议 GPL V2 GPL V3 GPL GPL V3 GPL V3 LGPL 数据存储方式 块 文件/Trunk 文件 块 文件/块 对象/文件/块 集群节点通信协议 私有协议&#xff08;T…

机器学习理论梳理1: PCA主成分分析

机器学习的理论部分学习知识点比较乱且杂。我这里通过几篇文章&#xff0c;简单总结一下自己对机器学习理论的理解&#xff0c;以防遗忘。第一篇文章主要概述了机器学习的基本任务以及一个常用的降维方法&#xff0c;主成分分析。 机器学习的基本任务 机器学习能实现许多不同…

NLP基础 : HMM 隐马尔可夫模型

Hidden Markov Model, HMM 隐马尔可夫模型&#xff0c;是一种描述隐性变量(状态)和显性变量(观测状态)之间关系的模型。该模型遵循两个假设&#xff0c;隐性状态i只取决于前一个隐性状态i-1&#xff0c;而与其他先前的隐形状态无关。观测状态也只取决于当前的隐形状态。因此我们…

关于秒杀系统优化方向

今天听了一节咕泡学院的公开课&#xff0c;有收获。 秒杀系统的特点&#xff1a; 1.限时&#xff1b;2.限量供应&#xff1b;3.并发量大&#xff1b;如何优化&#xff1a; 1.客户端数据缓存。 2.CDN加速。 3.nginx动静分离&#xff0c;静态资源缓存&#xff0c;负载均衡。 4.se…

RUNOOB python练习题1

用来练手的python 练习题&#xff0c;原链接 : python练习实例1 题干 : 有四个数字&#xff1a;1、2、3、4&#xff0c;能组成多少个互不相同且无重复数字的三位数&#xff1f;各是多少&#xff1f; import numpy as np cen np.array([1,2,3,4]) tens np.array([1,2,3,4])…

MySQL 亿级数据需求的优化思路(一),交易流水记录的查询

对MySQL的性能和亿级数据的处理方法思考&#xff0c;以及分库分表到底该如何做&#xff0c;在什么场景比较合适&#xff1f; 比如银行交易流水记录的查询 限盐少许&#xff0c;上实际实验过程&#xff0c;以下是在实验的过程中做一些操作&#xff0c;以及踩过的一些坑&#…

RUNOOB python练习题2

用来练手的python 练习题&#xff0c;原链接 : python练习实例2 题干 : 企业发放的奖金根据利润提成。利润(I)低于或等于10万元时&#xff0c;奖金可提10%&#xff1b;利润高于10万元&#xff0c;低于20万元时&#xff0c;低于10万元的部分按10%提成&#xff0c;高于10万元的…