睡眠声音识别中的准确率问题(二)--测试结果及分析

1 测试数据集介绍

(1)Audioset数据集: 从该数据集中筛选出鼾声数据500条;
(2)人工采集的数据集:我们收集了鼾声及咳嗽数据50条,其中鼾声数据40条,咳嗽数据10条,利用shuteye录制。

2 评价指标

原始标签:1个或者多个;
预测标签:top-n个标签;
评价方法:如果原始标签在预测标签中出现,则认为预测正确,此处不考虑原始标签在预测标签中排名。例如Snoringtop-n之中,则认为该测试数据为Snoring数据,否则认为没有打鼾。最后的预测公式为:准确率 = 预测正确的个数 / 总的预测个数

3 测试结果

3.1 鼾声测试

3.1.1 AudioSet数据集

  • n1的时候,测试用例在100条时只有10%的正确率,测试用例在300条时达到16.2%的正确率,测试用例在500条时达到16.2%的正确率。
    在这里插入图片描述

  • n2的时候,测试用例在100条时只有57%的正确率,测试用例在300条时达到64.7%的正确率,测试用例在500条时达到70.2%的正确率。
    在这里插入图片描述

  • n3的时候,测试用例在100条时只有80%的正确率,测试用例在300条时达到80.7%的正确率,测试用例在500条时达到84.8%的正确率。
    在这里插入图片描述

  • n4的时候,测试用例在100条时只有83%的正确率,测试用例在300条时达到84.3%的正确率,测试用例在500条时达到87.6%的正确率。
    在这里插入图片描述

  • n5的时候,测试用例在100条时达到84%的正确率,测试用例在300条时达到85%的正确率,测试用例在500条时达到88.4%的正确率。
    在这里插入图片描述

  • n6的时候,测试用例在100条时达到84%的正确率,测试用例在300条时达到86%的正确率,测试用例在500条时达到89.2%的正确率。

  • n7的时候,测试用例在100条时达到87%的正确率,测试用例在300条时达到88%的正确率,测试用例在500条时达到90.4%的正确率。

  • n8的时候,测试用例在100条时达到87%的正确率,测试用例在300条时达到88.67%的正确率,测试用例在500条时达到90.8%的正确率。

  • n9的时候,测试用例在100条时达到88%的正确率,测试用例在300条时达到89.67%的正确率,测试用例在500条时达到91.6%的正确率。

  • n10的时候,测试用例在100条时达到87%的正确率,测试用例在300条时达到90.6%的正确率,测试用例在500条时达到92.4%的正确率。

3.1.2 人工数据集

人工采集数据来源于自己录制,相比audioset中的音频,,n1的准确率为0n2的准确率最后只有30%n3的准确率最后只有58.7%n4的准确率最后只有60.9%n5~9的效果都准确率最后只有75%+

n10 的时候最后准确率在78%左右。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-z8A3T8DN-1628212451192)(C:\Users\fake\AppData\Roaming\Typora\typora-user-images\image-20210805182351019.png)]
原因分析:采集的数据中背景噪声较大,且有些音频存在大段静默(占80%左右),打鼾声音很微弱,因此预测效果没有Audioset的准确率高。

3.2 Cough测试:人工数据集

由于Cough数据较少,因此在网上也收集了一些相关音频,测试结果如下。n5的时候,准确率为80%;n10的时候,准确率依旧为80%左右。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8J0Qr05E-1628212451195)(C:\Users\fake\AppData\Roaming\Typora\typora-user-images\image-20210805184138225.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Or04aWST-1628212451196)(C:\Users\fake\AppData\Roaming\Typora\typora-user-images\image-20210805184145504.png)]

4 讨论

在测试的时候,很重要在于测试数据采集是否准确。
目前在人工收集数据的时候,主要用到蜗牛睡眠和shuteye,两个软件对比如下:

  • 蜗牛睡眠只能录鼾声和梦话,并且不够准确,好处就是免费;
  • shuteye可以录鼾声、梦话、咳嗽、磨牙、噪音等,种类比蜗牛睡眠多,录得也要准确些,需要付费。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507675.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

睡眠声音识别中的准确率问题(三)--采集的音频测试结果及分析

简介 本次我们对自己采集的93条Snoring音频进行测试并分析。 不区分音频质量的测试。 分别测试了NNN取1-5、8以及10时候的准确率,测试结果如下所示: N2345810Accuracy0.27960.47310.49460.49460.54840.5699 分析:从上表中可以得出…

研究c语言,研究c语言计算机编程实验.docx

2019年研究C语言计算机编程实验C语言是计算机软件编程设计中的一种重要应用语言,也是高等院校计算机专业中实践性较强的一门计算机编程教学课程,研究C语言计算机编程实验是为各位计算机的同学推荐的论文,欢迎大家阅读探究计算机移动技术应用!…

学完python基础后该学什么_想提一个老生常谈的问题, Python 基础学完后我应该干啥?...

日期 : 2020-09-21 09:48:32作者 : 南门老徐三十岁是一个迷茫的年纪,之前所有的信念都会在这一刻烟消云散。我是做数据的,非科班出身,除了数据啥也不会....java 我也不会,丢人不?而且数据也感觉自己并不咋地&#xff5…

中文 转gbk编码_go查找中文首字母

前言常见的通讯录都是按首字母来排序的,想象一下你要实现一个首字母排序的功能,若是全英文,那将会是一件很轻松的事情,一般语言层面就会提供排序方法,亦或自己实现也不是难事,那如果存在中文呢?…

c语言printf的%f语句,在C语言里printf是什么意思怎么

在C语言里printf是什么意思?怎么用??1,printf()函数是格式化输出函数, 一般用于向标准输出设备按规定格式输出信息。2,printf()函数的调用格式为: printf("", )。3,格式输出,它是c语言中产生格式化输出的函…

语音增强相关技术综述

1 非监督语音增强技术 2 监督语音增强技术 3 github上提供的源代码及分析 3.1 Dual-signal Transformation LSTM Network 简介 https://github.com/breizhn/DTLN 用于实时噪声抑制的堆叠双信号变换 LSTM 网络 (DTLN) 的 Tensorflow 2.x 实现。这个存储库提供了在 python …

睡眠音频分割及识别问题(十二)--基于IOS的YAMNet音频识别(总结)

1 结构体 此部分定义了两个结构体用于存储音频信息: AudioFragment:用于存储单个音频片段(0.975s, 16000Hz)的标签评分信息;AudioInfo:用于存储整个音频信息,包含音频文件名、时间等基础信息&…

js 字符串替换_正则精要:玩转JS正则表达式,也许只需这一篇(建议收藏)

0.导引在正文开始前,先说说正则表达式是什么,为什么要用正则表达式?正则表达式在我个人看来就是一个程序可以识别的规则,有了这个规则,程序就可以帮我们判断某些字符是否符合我们的要求。但是,我们为什么要…

小米平板android最新版本,想要翻身还需努力 小米平板2安卓版评测

1依旧发烧?小米平板2评测如今的平板市场虽不能用日薄西山来形容,但各大厂商费尽心机惨淡经营也无力阻止平板电脑市场的衰落,iPad Air和Mini系列的销量下滑迫使苹果不得不用寄希望于iPad Pro打开一片新天地,而在手机行业风生水起了…

android 滑动过程 触发,android 代码实现模拟用户点击、滑动等操作

/*** 模拟用户点击** param view 要触发操作的view* param x 相对于要操作view的左上角x轴偏移量* param y 相对于要操作view的左上角y轴偏移量*/private static void analogUserClick(View view, float x, float y) {if (view null) {return;}LogUtil.e(TAG_POINT, "正在…

国内计算机类APP相关竞赛总结

中国高校计算机大赛–移动应用创新赛 http://www.appcontest.net/ 中国高校计算机大赛—移动应用创新赛”旨在促进高校计算机课程教学内容和教学方法改革,激发学生创新意识,提升学生利用计算机分析问题、解决问题的能力,特别是移动应用的设计…

flink 写kafka_flink消费kafka的offset与checkpoint

生产环境有个作业,逻辑很简单,读取kafka的数据,然后使用hive catalog,实时写入hbase,hive,redis。使用的flink版本为1.11.1。为了防止写入hive的文件数量过多,我设置了checkpoint为30分钟。env.…

论文阅读:超高分辨率图像中快速、准确的条码检测

摘要 由于目标对象的尺度不同,超高分辨率 (UHR) 图像中的对象检测长期以来一直是计算机视觉中的一个具有挑战性的问题。在条码检测方面,将 UHR 输入图像调整为更小的尺寸通常会导致相关信息的丢失,而直接处理它们的效率很高且计算成本很高。…

android 多线程 场景,精选Android初中级面试题 (三): 深探Handler,多线程,Bitmap

码个蛋(codeegg) 第 930 次推文作者:Focusing链接:https://juejin.im/post/5c85cead5188257c6703af47Handler1、谈谈消息机制Handler作用 ?有哪些要素 ?流程是怎样的 ?参考回答:负责跨线程通信,…

python计算bmi的编程_Python学习-计算BMI的小程序

示例:小明身高1.75,体重80.5kg。请根据BMI公式(体重除以身高的平方)帮小明计算他的BMI指数,并根据BMI指数:低于18.5:过轻18.5-25:正常25-28:过重28-32:肥胖高于32:严重肥…

通过超分辨率重构来提高二维码的对比度

1 问题描述 (1)图像分辨率小。例如一些嵌入在海报(如图1)或远距离拍摄的码,其分辨率远小于通常情况下的码图像。 图1.海报中的二维码占比很小 (2)图像质量较低。有很多是经过了多次的压缩和转…

android web 访问数据库,Web下的JDBC访问数据库的基本步骤

Web下的JDBC访问数据库的基本步骤(2012-06-02 12:09:33)在Java程序中连接数据库的一般步骤分为一下几部分,我摘录出来,跟大家分享。(1)将数据库的JABC驱动加载到classpath中,在基于JavaEE的Web应用开发过程中,通常把JDBC驱动放在W…

linux 磁盘扩容_记录一次ESXi Linux在线扩容,不重启系统

因为工作需要,需要将运行在ESXi主机上面的一台Centos 里面的一个LV卷进行扩容,下面记录了此次扩展的详细过程,整个过程,不需要重启服务器。1. 首先通过df-h 查看当前磁盘结构如下:我们此次的最终目标,就是将…

我目前的主要研究方向

推荐系统 https://blog.csdn.net/search_129_hr/article/details/118680185 游戏难度动态调整 https://blog.csdn.net/search_129_hr/article/details/119204173 睡眠声音识别与增强 https://blog.csdn.net/search_129_hr/article/details/118568452 二维码图像识别与增强…

linux的任务计划6,Linux计划任务

Linux计划任务:未来的某个时间执行一次任务,或者周期性执行某个任务,执行结果会通过邮件通知定时任务:at batch周期性任务:crontab系统任务调度:/ect/crontab用户任务调度:/var/spool/cronmail​…