DCASE 2013任务1(声学场景分类)参赛作品相关信息

  本文资料来源于DCASE 2013以及上面下载的各个参赛组的技术报告(应该就是扩展摘要)

参赛者及其作品:

Table2

注意:图中的参考文献[46-56]就是对应的参赛者提交作品的技术报告(也就是扩展摘要)。

DCASE_2013Result

(1)Chum et al[1]

  • 简介:这里开发了两种算法:第一种是基于隐马尔可夫模型(HMM)和高斯混合模型(GMM)。 所使用的特征包括短时傅立叶变换,响度和光谱稀疏度。 第二种算法在基于帧的层面上应用支持向量机(SVM)。

  • code:CHR

  • 方法:在两个框架的不同的特征,分类:(a):前框架SVM+多数表决;(b):HMM

  • 开发语言:matlab

  • 相关的文章:M. Chum, A. Habshush, A. Rahman, and C. Sang, “IEEE AASP scene classification challenge using hidden Markov models and frame based classification,” 2013.

  • 成员

    • Dan Stowell(dan.stowell@eecs.qmul.ac.uk),Manager
    • Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
    • Mark Plumbley (m.plumbley@surrey.ac.uk),Manager

(2)Geiger et al[3]

  • 简介:这是对声学场景分类的IEEE AASP挑战的贡献。 从30秒长的高可变录音中,提取频谱,倒谱,能量和声音相关的音频特征。 使用滑动窗口方法来获得短段上低级特征的统计学特征。 SVM用于对这些短段进行分类,并采用多数投票方案来获得整个记录的决策。 关于挑战的官方发展,实现了73%的准确性。 使用t统计量的特征分析表明,主要的Mel谱是最相关的特征。
  • code:GSR

  • 方法:不同的特征,在4秒的窗口中使用SVM进行分类,然后投票表决

  • 开发语言:Weka/HTK

  • 相关文章

    • (1)J. T. Geiger, B. Schuller, and G. Rigoll, “Recognising acoustic scenes with large-scale audio feature extraction and SVM,” 2013.
    • (2)J. T. Geiger, B. Schuller, and G. Rigoll, “Large-Scale Audio Feature Extraction and SVM for Acoustic Scene Classification,” in WASPAA, 2013, p. 4.(有代码)
  • 成员

    • Dan Stowell (dan.stowell@eecs.qmul.ac.uk),Manager
    • Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
    • Jürgen Geiger (geiger@tum.de),Manager
    • Mark Plumbley (m.plumbley@surrey.ac.uk),Manager

Olivetti[8]

  • 简介:我们提出一种方法,将一般对象(如音频样本)有效地嵌入到矢量特征空间中,适用于分类问题。从实践的角度来看,采用提出的方法的研究者只需要提供两个成分:这些对象的高效压缩器,以及将两个对象组合成新对象的方式。所提出的方法基于两个主要元素:不相似性表示和归一化压缩距离(NCD)。不相似性表示是欧几里德嵌入算法,即将通用对象映射到向量空间中的过程,其需要在对象之间定义距离函数。所产生的嵌入的质量严格依赖于该距离的选择。 NCD是基于Kolmogorov复杂性概念的对象之间的距离。在实践中,NCD基于两个构建块:压缩函数和将两个对象组合成新对象的方法。我们声称,一旦良好的压缩机和有意义的组合两个对象的方法可用,则可以构建分类算法可以准确的有效特征空间。作为我们向IEEE AASP挑战提交的文件,我们在声场分类的上下文中展示了所提出的方法的实际应用,其中压缩器是自由和开源的Vorbis有损音频压缩器,并且两个音频样本的组合是它们的简单连接。

  • code:OE

  • 方法:归一化压缩距离(vorbis),欧几里德嵌入,由随机森林分类

  • 开发语言:Phyon

  • 相关文章

    • E. Olivetti, “The wonders of the normalized compression dissimilarity representation,” 2013.
  • 成员

    • Dan Stowell (dan.stowell@eecs.qmul.ac.uk),Manager
    • Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
    • Mark Plumbley (m.plumbley@surrey.ac.uk),Manager

Roma et al[11]

  • 简介:该代码使用重复量化分析(RQA)功能进行场景分类任务。 这些特征是通过从MFCC特征的窗口计算出的阈值相似度矩阵来计算的。 增加了传统的MFCC统计,它们在使用标准SVM分类器时提高了准确性。

  • code:RNH

  • 方法:复发定量分析应用于MFCC时间序列,由SVM分类

  • 开发语言:matlab

  • 相关文章

    • (1)G. Roma, W. Nogueira, and P. Herrera, “Recurrence Quantification Analysis for auditory scene classification,” 2013.
  • 成员

    • Dan Stowell (dan.stowell@eecs.qmul.ac.uk),Manager
    • Emmanouil Benetos (emmanouil.benetos@qmul.ac.uk),Manager
    • Mark Plumbley (m.plumbley@surrey.ac.uk),Manager

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/242771.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

空间谱专题06:宽带信号处理思路

作者:桂。 时间:2017-09-09 20:04:22 链接:http://www.cnblogs.com/xingshansi/p/7413139.html 前言 目前分析的问题,仍然限定在布阵的环节,暂不涉及后处理及硬件实现。 一、宽带处理的一般方式 前面分析的阵列信号模…

定时任务调度:crond任务调度

定时任务调度:crond任务调度 可以先写一个脚本,在调用这个脚本

DCASE 2017声场分类任务描述——数据集及基线系统

前言DCASE 2017继续通过比较使用公共可用数据集的不同方法来支持计算场景和事件分析方法的开发。 声音带有大量有关我们日常环境和身体事件的信息。我们可以感受到我们所在的声音场景(繁忙的街道,办公室等),并且识别出各种声源&am…

空间谱专题07:干涉仪仿真思路

作者:桂。 时间:2017-09-09 20:35:57 链接:http://www.cnblogs.com/xingshansi/p/7499247.html 前言 主要验证信道化前后,测向的有效性。相比空间谱的思路,干涉仪需要的信息更少,从干涉仪入手进行分析&am…

统计学习概论

统计学习的定义统计学习(statistical learning):关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。统计学习也称为统计机器学习。 统计学习的特点特点 统计学习以计算机机网络为平台,是建立在计算机…

Linux磁盘分区,挂载

Linux磁盘分区,挂载 保存退出:wq

空间谱专题09:阵列信号建模方法

作者:桂。 时间:2017-09-11 22:22:57 链接:http://www.cnblogs.com/xingshansi/p/7507616.html 前言 干涉仪、空间谱或者基于Beamforming的信号接收,都会面临窄带(或连续波-点频)、宽带的问题&#xff0c…

比幅测向及圆锥效应

作者:桂。 时间:2017-09-19 05:15:59 链接:http://www.cnblogs.com/xingshansi/p/7549461.html 一、比幅测向原理 以三波束比幅为例,其中轴线角度分别为 则天线n与左右相邻的天线波束可表述为 分别取对数运算(L、R原…

兔耳效应

作者:桂。 时间:2017-09-19 06:17:41 链接:http://www.cnblogs.com/xingshansi/p/7533286.html 前言 兔耳效应(double-pulse effect / rabbit-ears effect) )主要指矩形脉冲信号能量将扩散到与真实载频所在信道相邻的…

Linux网络不可用(Linux网络设置)

Linux网络不可用(Linux网络设置) 出现如下情况时 首先进行问题排查 在终端输入 ping www.baidu.com 如果能够ping通则可能是Firefox没有配置好,配置一下自动连接网络即可。 如果ping不通则可能就是虚拟机网络配置问题。 解决方法 &#x…

子空间分析方法

作者:桂。 时间:2017-09-19 20:44:54 链接:http://www.cnblogs.com/xingshansi/p/7554200.html 前言 空间谱中的MUSIC借助了子空间的思想,梳理一下子空间算法。 一、信号模型 假设观测矩阵A含有观测噪声: 定义相关矩…

空间谱专题10:MUSIC算法

作者:桂。 时间:2017-09-19 19:41:40 链接:http://www.cnblogs.com/xingshansi/p/7553746.html 前言 MUSIC(Multiple Signal Classification)算法通常用来进行到达角(DOA,Direction of arriva…

磁盘情况查询

磁盘情况查询 注意需要在联网的情况下

Linux网络配置原理图

Linux网络配置原理图 会发现你的Linux系统的IP和你的主机IP是在同一个网段 设计主机名和hosts映射

进程管理(重点)

进程管理(重点)

服务(service)管理

服务(service)管理 按q退出

空间谱专题11:子阵平滑与秩亏缺

作者:桂。 时间:2017-09-29 21:20:18 链接:http://www.cnblogs.com/xingshansi/p/7612984.html 前言 主要分析在解相干算法中,子阵平滑的有效性。 一、前向平滑 以均匀线阵(ULA)为例,第l个接收…

空间谱专题12:二维测向的基本方法

作者:桂。 时间:2017-10-01 16:50:08 链接:http://www.cnblogs.com/xingshansi/p/7617442.html 前言 圆阵、面阵、L阵、十字阵、V形阵,都是直接地二维求解,复杂度较高,这里梳理复杂度较低的求解算法。 一…