基于UrBAN数据集:用声音监测和预测蜜蜂群体的健康状况

     蜜蜂在生态平衡中扮演着关键角色,是农业作物和自然生态系统中的重要传粉者。它们不仅生产蜂蜜和蜂蜡,还对许多水果和种子作物产生影响,包括杏仁、柑橘类水果和蓝莓等。蜜蜂群体的健康状况和数量的下降可能对农业产业产生重大影响。全球范围内已经观察到显著的蜜蜂群体损失,这些损失归因于多种压力因素,这些因素可能独立或共同作用,包括杀虫剂、病原体、寄生虫、气候变化以及其他因素。

    蜜蜂群体的健康状况直接影响其授粉能力和生产效率。因此,监测蜜蜂的健康状况对于保护这一关键物种至关重要。传统的蜜蜂监测方法依赖于人工和视觉检查,这不仅劳动密集,而且可能会干扰蜂群,导致监测不够频繁。由于蜜蜂种群健康和数量的下降可能对农业产业产生深远影响,因此需要更科学的方法来持续监测蜜蜂群体的状态

     随着物联网技术的发展,精准养蜂领域出现了自动化蜂箱监测工具。这些工具利用传感器技术在蜂箱内部进行实时监测,可以更有效地评估蜜蜂群体的状态。这些自动化监测系统通常在蜂箱内部部署多种传感器,用于收集关于温度、湿度、蜂箱重量和声音等数据。这些数据可以提供有关蜜蜂群体活动和健康状况的实时信息。温度稳定性对蜜蜂健康和幼虫发育至关重要,直接影响蜂箱的生产力。相对湿度则影响幼虫生长、群体发展和蜜蜂行为,其变化还会影响水分运输和喂养。

     蜜蜂通过振动和声音信号进行内部交流,这些信号由身体运动、翅膀拍打和肌肉收缩产生。这些声音信号与不同的事件相关,如螨虫攻击、蜂后失败和蜂群分蜂,使声音成为蜂箱监测的理想方式。

1 UrBAN数据集

UrBAN数据集是从加拿大蒙特利尔的一个城市屋顶蜂场收集的,涵盖了2021年至2022年的时间段。数据集包括10个蜂箱,配备了麦克风记录超过2000小时的原始音频。同时,还有传感器持续监测温度和湿度。

  • 多模态数据:数据集包含了多种类型的数据,包括原始音频记录、温度和湿度的传感器读数,以及其他与蜂箱检查相关的指标。
  • 时间跨度:数据集覆盖了2021年至2022年的时间段,提供了两年内收集的连续数据。
  • 蜂箱数量:数据集涉及10个蜂箱,每个蜂箱都有其独特的标识符,以区分数据。
  • 音频数据:每个蜂箱都通过麦克风记录了超过2000小时的高质量原始音频。音频数据以 WAV 文件格式存储,并进行了压缩以便于下载。
  • 传感器数据:

      温度和湿度:使用 Beecon 传感器(Nectar Technologies Inc, Canada)在蜂箱内部连续监测温度和湿度,每15分钟记录一次。

     外部环境数据:包括外部温度、湿度和降雨量,这些数据从加拿大环境和气候变化部的网站获取。

  • 检查数据:定期对蜂箱进行检查,记录包括蜜蜂群体数量、蜂后状况、瓦螨侵染率和冬季死亡率等指标。
  • 数据文件:

     检查文件(inspections_2021.csv 和 inspections_2022.csv):包含每次检查的详细信息,如蜜蜂群体的框数、瓦螨侵染的存在、蜂后状态和死亡率。

     传感器数据文件(sensor_2021.csv 和 audio_2021、audio_2022 文件夹):包含内部温度、湿度和音频文件的名称。

      天气信息文件(weather_2021_2022.csv):记录了外部环境的温度、湿度、风速和降水量。

  • 数据的组织方式:数据被组织成表格和文件,以便于使用数据科学工具进行分析。例如,Pandas 库可以用来读取 CSV 文件,而 Librosa 库可以用来处理音频文件。
  • 数据的可访问性:UrBAN 数据集完全公开可用,研究者可以通过 Federated Research Data Repository 访问和下载数据。
  • 数据的预处理:数据集提供了预处理的选项,例如音频信号的增强,以减少环境噪声并提高监测系统的有效性。
  • 数据的机器学习应用:数据集的结构设计考虑了机器学习应用,提供了特征提取和模型训练所需的数据格式。
  • 数据的多样性:数据集不仅包括了定量的传感器读数,还包括了定性的检查结果。
  • UrBAN数据集下载地址

UrBAN: Urban Beehive Acoustics and PheNotyping Dataset | FRDR-DFDR

2 实验

2.1 音频增强

  • 环境噪声去除:为了提高监测系统的有效性,采用了谱幅度减法技术来去除蜜蜂音频中的环境噪声。这一步骤对于准确检测和分析蜂箱内的重要行为和事件至关重要。
  • 算法实现:使用指数移动平均(EMA)滤波器和自适应算法来估计噪声,并通过谱减法算法从音频信号中减去噪声谱,从而得到更清晰的音频记录。

2.2 特征提取

  • 特征集定义:在音频信号预处理和噪声去除之后,提取了四组特征集,包括梅尔频率倒谱系数(MFCCs)、线性频率倒谱系数(LFCCs)、频谱形状描述符和一些手工制作的参数(如蜂箱功率、音频带宽密度比等),用于预测蜜蜂音频帧的状态。
  • 特征计算:MFCCs和LFCCs是通过将音频信号映射到梅尔尺度上进行计算的,而频谱形状描述符包括中心频率、带宽、偏度、峰度等九个特征。

2.3 机器学习框架

构建了一个基于音频分析的机器学习框架,用于预测蜂箱强度。这个框架包括信号测量、预处理、特征提取和回归等步骤。探索了多种特征选择技术,如随机森林特征重要性、主成分分析(PCA)、最小冗余最大相关性(mRMR)和SHAP值解释。

2.4 模型验证

  • 预测任务:使用蜜蜂框数预测作为任务来验证数据集。通过两种不同的实验配置(随机分割和蜂箱独立)来进行模型的训练和测试。

    随机分割(Random-Split):将数据集随机分为训练集(50%)、验证集(25%)和测试集(25%)。

    蜂箱独立(Hive-Independent):使用10个蜂箱进行训练,4个进行验证,另外4个进行测试。

  • 性能评估:模型评估采用了三个关键指标:

    平均绝对误差(MAE):预测值与实际值之间差的绝对值的平均。

    均方根误差(RMSE):预测误差平方的平均数的平方根,衡量预测误差的大小。

    皮尔逊相关系数:衡量预测值与实际值之间的线性相关性。

3 结论

  • UrBAN数据集能够有效地用于蜜蜂群体的监测和研究。特征提取和机器学习模型能够基于音频数据预测蜜蜂群体的数量。
  • 音频增强技术,特别是频谱幅度减法,对于提高音频数据的监测效果至关重要。它有助于去除背景噪声,从而提高特征提取的准确性和模型的预测性能
  • 梅尔频率倒谱系数MFCCs在大多数情况下优于其他特征集,且在进行了谱幅度减法后的性能有所提升。
  • 使用随机森林回归器,结合所提取的特征,模型在预测蜜蜂帧数的任务上表现出了良好的性能,这通过MAE、RMSE和皮尔逊相关系数等指标得到了验证

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/24339.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python爬取城市空气质量数据

Python爬取城市空气质量数据 一、思路分析1、寻找数据接口2、发送请求3、解析数据4、保存数据二、完整代码一、思路分析 目标数据所在的网站是天气后报网站,网址为:www.tianqihoubao.com,需要采集武汉市近十年每天的空气质量数据。先看一下爬取后的数据情况: 1、寻找数据…

2024全国高考作文题解读(文心一言 4.0版本)

新课标I卷 阅读下面的材料,根据要求写作。(60分) 随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少? 以上材料引发了你怎样的联想和思考?请写…

大模型基础——从零实现一个Transformer(1)

一、Transformer模型架构图 主要模块: embedding层: Input/Output Embedding: 将每个标记(token)转换为对应的向量表示。 Positional Encoding:由于没有时序信息,需要额外加入位置编码。 N个 block堆叠: Multi-Head …

【QT5】<总览四> QT常见绘图、图表及动画

文章目录 前言 一、QFile类读写文件 二、QPainter绘简单图形 三、QChart图表 四、QPropertyAnimation属性动画 五、Q_PROPERTY宏简介 六、自定义属性动画 前言 承接【QT5】<总览三> QT常用控件。若存在版权问题,请联系作者删除&#…

Debezium系列之:记录一次debezium采集tdsql-c数据库数据丢失原因的排查

Debezium系列之:记录一次debezium采集tdsql-c数据库数据丢失原因的排查 一、背景二、排查数据丢失时间段数据采集情况三、捕获提交异常信息四、定位原因五、解决方案一、背景 debezium采集tdsql-c数据库,偶尔会出现数据丢失的情况,出现多次后决定整个链路排查定位问题二、排…

UE5 Mod Support 思路——纯蓝图

原创作者:Chatouille 核心功能 “Get Blueprint Assets”节点,用于加载未来的mod。用基础类BP_Base扩展即可。打包成补丁,放到Content\Paks目录下,即可让游戏访问到内容。 与文中所写不同的地方 5.1或者5.2开始,打…

uniapp封装picker选择器组件,支持关键字查询

CommonPicker.vue组件 路径在 components\CommonPicker.vue <template><view><uni-easyinput v-model"searchQuery" :placeholder"placeholder" /><picker :range"filteredOptions" :range-key"text" v-model&…

【Kubernetes】k8s中,Deployment、Service(svc)和 Pod 之间的关系

在Kubernetes&#xff08;k8s&#xff09;中&#xff0c;Deployment、Service&#xff08;svc&#xff09;和Pod之间的关系是构建、管理和访问容器化应用程序的核心组件。以下是它们之间的关系&#xff0c;以分点表示和归纳的方式描述&#xff1a; Pod&#xff1a; Pod是Kuber…

从零开始:疾控中心实验室装修攻略,让你的实验室一步到位!

在当今充满挑战和变化的世界中&#xff0c;疾病的控制和预防成为了人类生存与发展的重要课题。而疾控中心作为防控疾病的核心机构&#xff0c;其疾控中心实验室设计建设显得尤为重要。下面广州实验室装修公司小编将分享疾控中心实验室设计建设方案&#xff0c;为疾病防控工作提…

如何复制文件描述符

在Linux系统编程中&#xff0c;复制文件描述符是一个常见的操作&#xff0c;通常使用dup或dup2函数来实现。 复制文件描述符的主要原理是创建一个新的文件描述符&#xff0c;该描述符与原始描述符共享相同的文件表项。这意味着它们引用同一个打开的文件&#xff0c;可以进行相…

玩转STM32-通信协议SPI(详细-慢工出细活)

文章目录 一、SPI的基础知识1.1 接口定义1.2 单机和多机通信 二、STM32的SPI工作过程2.1 从选择&#xff08;NSS&#xff09;脚管理2.2 时钟相位与极性2.3 SPI主模式2.4 SPI从模式 三、应用实例 一、SPI的基础知识 1.1 接口定义 SPI系统可直接与各个厂家生产的多种标准外围器…

Python | 开房门(map)

常把map称之为映射&#xff0c;就是将一个元素&#xff08;通常称之为key键&#xff09;与一个相对应的值&#xff08;通常称之为value&#xff09;关联起来 通常用**字典dict**实现了映射这种数据结构 字典也是使用{}来包裹&#xff08;set也是{}&#xff09;&#xff0c;每…

ChatGPT-4o独家揭秘:全国一卷高考语文作文如何轻松斩获满分?

​一、2024年全国一卷高考 二、2018年全国一卷高考 三、2016年全国一卷高考 一、2024年全国一卷高考 技术进步的悖论&#xff1a;我们的问题真的在减少吗&#xff1f; 引言 随着互联网的普及和人工智能的应用&#xff0c;越来越多的问题能够快速得到解答。然而&#xff0c;这引…

网络空间安全数学基础·同余式

6.1 剩余系&#xff08;掌握&#xff09; 6.2 同余式概念与一次同余式&#xff08;熟练&#xff09; 6.3 中国剩余定理&#xff08;熟练&#xff09; 6.1 剩余系 设m是正整数&#xff0c;模m同余的全体整数是一个模m剩余类&#xff0c;即可表示为a qmr&#xff0c; 0≤r<…

idea使用和了解

官网&#xff1a;IntelliJ IDEA – the Leading Java and Kotlin IDE

【MyBatisPlus条件构造器】

文章目录 什么是条件构造器&#xff1f;使用步骤1. 引入 MyBatisPlus 依赖2. 创建实体类3. 使用条件构造器查询4. 执行查询 示例代码 什么是条件构造器&#xff1f; 条件构造器是 MyBatisPlus 提供的一种灵活的查询条件设置方式&#xff0c;它可以帮助开发者构建复杂的查询条件…

持续总结中!2024年面试必问 20 道分布式、微服务面试题(二)

上一篇地址&#xff1a;持续总结中&#xff01;2024年面试必问 20 道分布式、微服务面试题&#xff08;一&#xff09;-CSDN博客 三、CAP定理是什么&#xff1f; CAP定理是分布式系统理论中的一个基本概念&#xff0c;由计算机科学家Eric Brewer在2000年提出&#xff0c;并由…

常见的api:Runtime Object

一.Runtiem的成员方法 1.getRuntime() 当前系统的运行环境 2.exit 停止虚拟机 3.avaliableProcessors 获取Cpu线程的参数 4.maxMemory JVM能从系统中获取总内存大小(单位byte) 5.totalMemory JVM已经从系统中获取总内大小(单位byte) 6.freeMemory JVM剩余内存大小(…

数组对象数据修改后页面没有更新,无法进行编辑,校验失效问题

在 Vue 中&#xff0c;当你通过 Object.assign 或其他方式修改了对象中的某个属性时&#xff0c;Vue 并不会触发组件重新渲染&#xff0c;因此表单中的 input 框无法及时更新。这可能导致在修改表单数据后&#xff0c;页面没有更新&#xff0c;而且表单校验也失效的情况。这是因…

【MATLAB高级编程】入门篇 | 向量化编程

【入门篇】向量化编程 1. 什么是向量?2. 向量的创建2.1 行向量2.2 列向量2.3 使用冒号运算符2.4 使用`linspace`和`logspace`3. 向量的基本操作3.1 向量元素访问3.2 向量的长度3.3 向量的加法和减法3.4 向量的点乘和叉乘3.5 向量的元素乘法和除法4. 向量的高级操作4.1 逻辑索引…