音频分类研究的重点,一方面在于音频特征的提取和选择,通常来说数据集和特征集在分类系统中有着极为重要的作用,离开了对数据集的处理、对特征集中特征的提取和选择,分类结果必将产生巨大误差。对于提高音频分类系统的分类准确度和保证数据集的可用性来说,对音频数据进行预处理、提取并选择出对分类准确率有益的特征是必要的,但这部分的研究工作大多集中在数据挖掘领域,在音频信号分类领域往往受到忽视。另一方面在于分类算法的改进和优化,分类算法的运行效率和分类准确率等直接影响着分类系统的性能,但提高分类准确率和减少计算时间是一对矛盾问题,通过对目前已有分类算法的分析不难发现,仍然存在着诸如分类准确率低、算法复杂度高等问题。
在音频分类研究中,如何选择出对分类结果有益的和有害的特征量,如何选择和优化分类算法,对于提高音频分类系统的整体性能意义重大。综合来看,目前已有的研究中仍存在以下问题:1.用于分类的音频特征虽五花八门,但没有统一有效的标准可依,且用于分类的音频特征量有待增加;2.大多数已有的研究中,只是直接使用所提取的音频特征集进行分类实验,忽略了对音频特征集的筛选问题,且缺乏对相关特征选择算法的研究;3.现存算法虽然在音频分类研究中取得了一定成就,但仍存在缺点和不足,不同分类算法对不同分类对象的分类准确率仍有待提高。
本文采用小波和滤波器组理论对音频信号进行处理,运行环境为MATLAB R2018A,主要内容如下:
使用滤波器树结构建立听觉滤波器组
小波滤波器组
分解音频信号(Decomposition of an audio signal into tonal, transient and residual layers)
相位恢复和相位差分
使用具有不同时频分辨率的group lasso shrinkage进行音频分解
几个滤波器组 CQT, ERBLET and AUDLET filterbanks
滤波器组同步压缩变换和逆变换
用Gabor乘子近似缓慢时变系统
工学博士,担任《Mechanical System and Signal Processing》审稿专家,担任
《中国电机工程学报》优秀审稿专家,《控制与决策》,《系统工程与电子技术》,《电力系统保护与控制》,《宇航学报》等EI期刊审稿专家。
擅长领域:现代信号处理,机器学习,深度学习,数字孪生,时间序列分析,设备缺陷检测、设备异常检测、设备智能故障诊断与健康管理PHM等。