睡眠声音识别中的准确率问题(二)--测试结果及分析

1 测试数据集介绍

(1)Audioset数据集: 从该数据集中筛选出鼾声数据500条;
(2)人工采集的数据集:我们收集了鼾声及咳嗽数据50条,其中鼾声数据40条,咳嗽数据10条,利用shuteye录制。

2 评价指标

原始标签:1个或者多个;
预测标签:top-n个标签;
评价方法:如果原始标签在预测标签中出现,则认为预测正确,此处不考虑原始标签在预测标签中排名。例如Snoringtop-n之中,则认为该测试数据为Snoring数据,否则认为没有打鼾。最后的预测公式为:准确率 = 预测正确的个数 / 总的预测个数

3 测试结果

3.1 鼾声测试

3.1.1 AudioSet数据集

  • n1的时候,测试用例在100条时只有10%的正确率,测试用例在300条时达到16.2%的正确率,测试用例在500条时达到16.2%的正确率。
    在这里插入图片描述

  • n2的时候,测试用例在100条时只有57%的正确率,测试用例在300条时达到64.7%的正确率,测试用例在500条时达到70.2%的正确率。
    在这里插入图片描述

  • n3的时候,测试用例在100条时只有80%的正确率,测试用例在300条时达到80.7%的正确率,测试用例在500条时达到84.8%的正确率。
    在这里插入图片描述

  • n4的时候,测试用例在100条时只有83%的正确率,测试用例在300条时达到84.3%的正确率,测试用例在500条时达到87.6%的正确率。
    在这里插入图片描述

  • n5的时候,测试用例在100条时达到84%的正确率,测试用例在300条时达到85%的正确率,测试用例在500条时达到88.4%的正确率。
    在这里插入图片描述

  • n6的时候,测试用例在100条时达到84%的正确率,测试用例在300条时达到86%的正确率,测试用例在500条时达到89.2%的正确率。

  • n7的时候,测试用例在100条时达到87%的正确率,测试用例在300条时达到88%的正确率,测试用例在500条时达到90.4%的正确率。

  • n8的时候,测试用例在100条时达到87%的正确率,测试用例在300条时达到88.67%的正确率,测试用例在500条时达到90.8%的正确率。

  • n9的时候,测试用例在100条时达到88%的正确率,测试用例在300条时达到89.67%的正确率,测试用例在500条时达到91.6%的正确率。

  • n10的时候,测试用例在100条时达到87%的正确率,测试用例在300条时达到90.6%的正确率,测试用例在500条时达到92.4%的正确率。

3.1.2 人工数据集

人工采集数据来源于自己录制,相比audioset中的音频,,n1的准确率为0n2的准确率最后只有30%n3的准确率最后只有58.7%n4的准确率最后只有60.9%n5~9的效果都准确率最后只有75%+

n10 的时候最后准确率在78%左右。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-z8A3T8DN-1628212451192)(C:\Users\fake\AppData\Roaming\Typora\typora-user-images\image-20210805182351019.png)]
原因分析:采集的数据中背景噪声较大,且有些音频存在大段静默(占80%左右),打鼾声音很微弱,因此预测效果没有Audioset的准确率高。

3.2 Cough测试:人工数据集

由于Cough数据较少,因此在网上也收集了一些相关音频,测试结果如下。n5的时候,准确率为80%;n10的时候,准确率依旧为80%左右。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8J0Qr05E-1628212451195)(C:\Users\fake\AppData\Roaming\Typora\typora-user-images\image-20210805184138225.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Or04aWST-1628212451196)(C:\Users\fake\AppData\Roaming\Typora\typora-user-images\image-20210805184145504.png)]

4 讨论

在测试的时候,很重要在于测试数据采集是否准确。
目前在人工收集数据的时候,主要用到蜗牛睡眠和shuteye,两个软件对比如下:

  • 蜗牛睡眠只能录鼾声和梦话,并且不够准确,好处就是免费;
  • shuteye可以录鼾声、梦话、咳嗽、磨牙、噪音等,种类比蜗牛睡眠多,录得也要准确些,需要付费。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507675.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

睡眠声音识别中的准确率问题(三)--采集的音频测试结果及分析

简介 本次我们对自己采集的93条Snoring音频进行测试并分析。 不区分音频质量的测试。 分别测试了NNN取1-5、8以及10时候的准确率,测试结果如下所示: N2345810Accuracy0.27960.47310.49460.49460.54840.5699 分析:从上表中可以得出…

中文 转gbk编码_go查找中文首字母

前言常见的通讯录都是按首字母来排序的,想象一下你要实现一个首字母排序的功能,若是全英文,那将会是一件很轻松的事情,一般语言层面就会提供排序方法,亦或自己实现也不是难事,那如果存在中文呢?…

语音增强相关技术综述

1 非监督语音增强技术 2 监督语音增强技术 3 github上提供的源代码及分析 3.1 Dual-signal Transformation LSTM Network 简介 https://github.com/breizhn/DTLN 用于实时噪声抑制的堆叠双信号变换 LSTM 网络 (DTLN) 的 Tensorflow 2.x 实现。这个存储库提供了在 python …

睡眠音频分割及识别问题(十二)--基于IOS的YAMNet音频识别(总结)

1 结构体 此部分定义了两个结构体用于存储音频信息: AudioFragment:用于存储单个音频片段(0.975s, 16000Hz)的标签评分信息;AudioInfo:用于存储整个音频信息,包含音频文件名、时间等基础信息&…

js 字符串替换_正则精要:玩转JS正则表达式,也许只需这一篇(建议收藏)

0.导引在正文开始前,先说说正则表达式是什么,为什么要用正则表达式?正则表达式在我个人看来就是一个程序可以识别的规则,有了这个规则,程序就可以帮我们判断某些字符是否符合我们的要求。但是,我们为什么要…

小米平板android最新版本,想要翻身还需努力 小米平板2安卓版评测

1依旧发烧?小米平板2评测如今的平板市场虽不能用日薄西山来形容,但各大厂商费尽心机惨淡经营也无力阻止平板电脑市场的衰落,iPad Air和Mini系列的销量下滑迫使苹果不得不用寄希望于iPad Pro打开一片新天地,而在手机行业风生水起了…

国内计算机类APP相关竞赛总结

中国高校计算机大赛–移动应用创新赛 http://www.appcontest.net/ 中国高校计算机大赛—移动应用创新赛”旨在促进高校计算机课程教学内容和教学方法改革,激发学生创新意识,提升学生利用计算机分析问题、解决问题的能力,特别是移动应用的设计…

flink 写kafka_flink消费kafka的offset与checkpoint

生产环境有个作业,逻辑很简单,读取kafka的数据,然后使用hive catalog,实时写入hbase,hive,redis。使用的flink版本为1.11.1。为了防止写入hive的文件数量过多,我设置了checkpoint为30分钟。env.…

论文阅读:超高分辨率图像中快速、准确的条码检测

摘要 由于目标对象的尺度不同,超高分辨率 (UHR) 图像中的对象检测长期以来一直是计算机视觉中的一个具有挑战性的问题。在条码检测方面,将 UHR 输入图像调整为更小的尺寸通常会导致相关信息的丢失,而直接处理它们的效率很高且计算成本很高。…

android 多线程 场景,精选Android初中级面试题 (三): 深探Handler,多线程,Bitmap

码个蛋(codeegg) 第 930 次推文作者:Focusing链接:https://juejin.im/post/5c85cead5188257c6703af47Handler1、谈谈消息机制Handler作用 ?有哪些要素 ?流程是怎样的 ?参考回答:负责跨线程通信,…

通过超分辨率重构来提高二维码的对比度

1 问题描述 (1)图像分辨率小。例如一些嵌入在海报(如图1)或远距离拍摄的码,其分辨率远小于通常情况下的码图像。 图1.海报中的二维码占比很小 (2)图像质量较低。有很多是经过了多次的压缩和转…

android web 访问数据库,Web下的JDBC访问数据库的基本步骤

Web下的JDBC访问数据库的基本步骤(2012-06-02 12:09:33)在Java程序中连接数据库的一般步骤分为一下几部分,我摘录出来,跟大家分享。(1)将数据库的JABC驱动加载到classpath中,在基于JavaEE的Web应用开发过程中,通常把JDBC驱动放在W…

linux 磁盘扩容_记录一次ESXi Linux在线扩容,不重启系统

因为工作需要,需要将运行在ESXi主机上面的一台Centos 里面的一个LV卷进行扩容,下面记录了此次扩展的详细过程,整个过程,不需要重启服务器。1. 首先通过df-h 查看当前磁盘结构如下:我们此次的最终目标,就是将…

android item三种,Android RecyclerView中的ItemDecoration的几种绘制方法

如题,我们使用recyclerview的时候,如果没有设置显示条目的margin,或者padding的话,是没有分割线效果的。那么除去使用margin或padding,其余的方法是用itemdecoration绘制分割线我们绘制分割线的时候通常会使用drawable去绘制&…

上传文件和提交textfield_0基础掌握Django框架(37)文件上传

为了更好的学习效果,请搭配视频教程一起学习:Django零基础到项目实战 - 网易云课堂​study.163.com文件上传:文件上传是网站开发中非常常见的功能。这里详细讲述如何在Django中实现文件的上传功能。前端HTML代码实现:在前端中&…

华为p10刷原生android,华为p10怎么刷机 华为p10刷机方法【详细介绍】

喜欢折腾手机的用户一定对于手机root权限获取不陌生,root后虽然不能享受官方联保服务但同时带来的好处不用小编多说。前面给大家介绍了 华为p10 刷入第三方recovery教程,现在华为p10刷机包已经放出来,小编给大家带来华为p10刷机权限获取教程。…

使用container的嵌套_ElementUI 技术揭秘(4)— Container 布局容器组件的设计与实现。...

前言上一篇文章我们分析了 Layout 布局组件的设计和实现,它的应用场景通常是局部布局。对于整个页面的布局,element-ui 提供了 Container 布局容器组件,专门用于 PC 管理后台页面的整体布局。需求分析我们先通过几幅图看一下页面的常见布局。…

宝马屏幕共享android,宝马屏幕共享功能怎么用

【太平洋汽车网】使用宝马屏幕共享要先打开车载电脑多媒体功能,再选择屏幕共享手机投屏,勾掉宝马互联选项,然后再打开手机wifi,选择BMW输入密码即可使用屏幕共享。车手机互联映射即车机互联,就是将手机投屏到车载显示器…

“用于无监督图像生成解耦的正交雅可比正则化”论文解读

Tikhonov regularization terms https://blog.csdn.net/jiejinquanil/article/details/50411617 本文是对博客https://baijiahao.baidu.com/s?id1710942953471566583&wfrspider&forpc的重写。 1 简介 本文是对发表于计算机视觉和模式识别领域的顶级会议 ICCV 2021 的…

html带正方形项目列表,5种简单实用的css列表样式实例,可以直接用到项目中。...

谁不希望有一个好看而又干净的列表?这篇文章中我们给出几个实用的例子,你可以把他们直接用到自己的工作中。我们从一个带有动画效果的垂直列表开始,接着是一个图文混排的例子,然后是一个只有图片的list例子跟一个水平菜单的例子&a…