EuroCropsML:首个面向少样本时间序列作物分类的多国基准数据集

2025-04-15,由慕尼黑工业大学等机构创建的 EuroCropsML 数据集,这是一个结合了农民报告的作物数据与 Sentinel-2 卫星观测的时间序列数据集,覆盖了爱沙尼亚、拉脱维亚和葡萄牙。该数据集为解决遥感应用中作物类型数据空间不平衡问题提供了新的基准,有助于推动少样本学习和迁移学习算法在真实世界作物分类任务中的应用和评估。

一、研究背景

卫星遥感技术在农业领域发挥着重要作用,如作物类型分类、产量预测等。然而,不同地理区域的作物类型数据分布极不均衡,这种数据空间不平衡问题给准确的作物分类带来了挑战。为了克服这一问题,迁移学习和元学习算法应运而生,但它们在真实世界复杂应用中的表现尚待深入评估。

目前遇到困难和挑战:

1、数据空间不平衡:不同地区作物数据的丰富程度差异巨大,导致在数据匮乏地区难以直接应用基于数据丰富地区训练的模型。

2、算法泛化能力不足:现有的迁移学习和元学习算法在不同地理区域之间的知识迁移效果不佳,难以适应新地区的作物分类任务。

3、计算资源与性能的权衡:提高模型性能往往需要更多的计算资源和更长的训练时间,这在实际应用中可能会受到限制。

数据集地址:EuroCropsML|农业数据分析数据集|遥感技术数据集

二、让我们一起看一下EuroCropsML

EuroCropsML 是一个结合了农民报告的作物数据与 Sentinel-2 卫星观测的时间序列数据集,专为少样本作物类型分类任务设计。

该数据集基于 EuroCrops 参考数据,扩展了 Sentinel-2 L1C 反射率数据,覆盖了爱沙尼亚、拉脱维亚和葡萄牙的农业区域。为了减少数据不平衡问题,对某些频繁出现的作物类型(如牧草)进行了重采样。此外,还对数据进行了预处理,包括去除云层干扰和标准化等操作。

数据集包含 706,683 个具有多类标签的数据点,涉及 176 种不同的作物类型,其中 35 种在三个国家都有分布。每个数据点包含一年内无云的多光谱 Sentinel-2 观测数据的时间序列,时间步长多达 216 个。

数据集特点:

1、多国覆盖:包含来自爱沙尼亚、拉脱维亚和葡萄牙的农业数据,具有不同的气候条件和农业实践。

2、多类标签:涵盖了 176 种不同的作物类型,提供了丰富的分类任务。

3、时间序列数据:每个数据点包含一年内的多光谱 Sentinel-2 观测数据,能够反映作物的生长周期。

基准测试:

在基准测试中,MAML 类算法(如 MAML 和 ANIL)在少样本学习任务中表现最佳,其中 ANIL 在 500-shot 任务中达到了 65.2% 的分类准确率和 0.556 的 Cohen’s Kappa 系数,分别比无预训练提升了 2.0% 和 2.7%,显示出显著的性能提升,但这些算法的训练时间比传统方法长了 3-5 倍。

源区域和目标区域(使用 EuroCrops HCAT3 第 3 级(Schneider 等人,2023a,b))的农田可视化。初始训练在源区域的 Sentinel-2 L1C 农业时间序列上进行,随后在独立的目标区域对模型进行微调和评估。

目前,在欧盟27个成员国中,有17个国家的数据在EuroCrops数据集中实现了协调,而有四个国家仅提供了部分数据。数据的可用性指的是EuroCrops数据集的第10版。

根据农业参考数据的可用性对欧盟成员国进行排序。这指的是EuroCrops数据集的第10版

在三个感兴趣区域(ROI):爱沙尼亚、拉脱维亚和葡萄牙之间共享和独特的标注作物类别的数量。

构成EuroCropsML数据集的三个国家的数据点数量和不同的作物类别数量。数据点的数量指的是经过预处理后独特地块的数量

上部直方图显示了在预训练和微调数据集中,不同丰度(地块数量)的作物类别数量的分布情况。下部直方图则专注于爱沙尼亚的微调数据,展示了在预训练阶段是否见过的作物类别数量分布,这些数据仅来自拉脱维亚或拉脱维亚和葡萄牙。两个直方图均使用对数刻度。

用于采样元学习任务的拉脱维亚(左)和葡萄牙(右)的NUTS区域

三、展望EuroCropsML应用

案例:作物分类在农业管理中的应用

以前,农民们要想知道地里种的是啥作物,主要靠自己去田里看看,或者请专家来实地考察。这种方法不仅费时费力,还只能覆盖一小块地。要是地多了,根本忙不过来。而且,靠人眼识别,难免会出错,导致分类不准确。比如,有些作物长得差不多,很容易混淆。

另外,虽然卫星图像也能帮忙,但以前的卫星图像分析方法需要很多标注好的数据来训练模型。可问题是,不同地方的数据分布不一样,有些地方数据多,有些地方数据少,这就导致模型在数据少的地方表现不好,分类精度差。

现在,有了 EuroCropsML 数据集,农场可以这样操作:

1、数据预处理:用数据集里的卫星图像和农民报告的作物数据,先对农场的作物进行预训练。

2、模型训练:选一个好用的算法,比如 MAML 或 ANIL,在预训练的基础上稍微调整一下,就能适应农场的具体情况。

3、实时监测:把训练好的模型用起来,实时监测作物的生长情况,发现问题及时调整。

4、精准决策:根据分类结果,农民可以更科学地安排种植,选择合适的作物品种,优化灌溉和施肥计划。

这样一来,农场不仅分类更准了,还省了不少事儿,产量也提高了,实现了精准农业。

更多免费的数据集,请打开:遇见数据集

遇见数据集-让每个数据集都被发现,让每一次遇见都有价值。遇见数据集,领先的千万级数据集搜索引擎,实时追踪全球数据集,助力把握数据要素市场。https://www.selectdataset.com/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/901802.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

将python项目打包成Windows后台服务

前文,我开发了一个基于windows11与本地deepseek实现的语音助手,之前是通过CMD直接执行项目的main.py文件。但是这样不适合移植,现在想将其生成一个exe文件,以及部署成windows的后台服务。 关于语音助手的开发与发布,可以看的CSDN文章:一个基于windows11与本地deepseek实…

yolov8复现

Yolov8的复现流程主要包含环境配置、下载源码和验证环境三大步骤: 环境配置 查看电脑状况:通过任务管理器查看电脑是否有独立显卡(NVIDIA卡)。若有,后续可安装GPU版本的pytorch以加速训练;若没有&#xff0…

Yocto项目实战教程 · 第4章:4.1小节元数据

🔍 B站相应的视频教程: 📌 Yocto项目实战教程-第4章-4.1小节-元数据 记得三连,标为原始粉丝。 在嵌入式Linux系统构建中,Yocto项目凭借其高度模块化、可配置的特性成为主流工具。而其背后的关键支撑之一,便…

《AI大模型应知应会100篇》第23篇:角色扮演技巧:让AI成为你需要的专家

第23篇:角色扮演技巧:让AI成为你需要的专家 摘要 在当今人工智能快速发展的时代,大模型已经不仅仅是简单的问答工具,它们可以通过角色扮演技巧模拟各类专家身份,从而为用户提供更专业、更有针对性的服务。本文将深入探…

Windows系统安装RustDesk Server的详细步骤和客户端设置

Windows系统安装RustDesk Server的详细步骤 在Windows系统上安装RustDesk Server涉及几个关键步骤,包括安装必要的依赖、下载RustDesk Server程序、配置并启动服务。以下是详细的步骤: 1. 安装Node.js和PM2 RustDesk Server的某些版本可能需要Node.js环境来运行,而PM2是一…

如何实现一个构造函数继承另一个构造函数的属性和方法?给出ES5和ES6两种方式

在 JavaScript 中,构造函数继承可以通过 原型链 和 构造函数调用 实现。以下是 ES5 和 ES6 的实现方式: ES5 实现方式 关键步骤 继承实例属性:在子构造函数中调用父构造函数的 call/apply,绑定 this。继承原型方法:将…

AWS Redshift的使用场景及一些常见问题

Redshift 不是关系型数据库, 提供了Amazon Redshift Serverless 和 Amazon Redshift 都是构建于 Redshift 数仓引擎之上的,但它们适用的场景不同。Redshift和Dynamodb都可以存储数据, 分别怎么选择? 这里记录一些常见的问题和场景。 1. 如何选择用Amazon Redshift…

十五种光电器件综合对比——《器件手册--光电器件》

十五、光电器件 名称 原理 特点 应用 发光二极管(LED) 基于半导体材料的电致发光效应,当电流通过时,电子与空穴复合,释放出光子。 高效、节能、寿命长、响应速度快、体积小。 广泛用于指示灯、照明、显示&#…

Electricity Market Optimization(VI) - 机组组合模型以及 Gurobi 求解

本文参考链接:link \hspace{1.6em} 机组组合问题在电力系统中非常重要,这个问题也是一个优化问题,研究的就是如何调度现有的机组,调度的对象是以煤炭、石油、天然气为燃料的火力发电机以及水力发电机等可预测处理的发电机组&#…

linux多线(进)程编程——(8)多进程的冲突问题

前言 随着时间的推移,共享内存已经在修真界已经沦为禁术。因为使用这种方式沟通的两人往往会陷入到走火入魔的状态,思维扭曲。进程君父子见到这种情况,连忙开始专研起来,终于它们发现了共享内存存在的问题: 进程间冲…

网络层IP协议知识大梳理

全是通俗易懂的讲解,如果你本节之前的知识都掌握清楚,那就速速来看我的IP协议笔记吧~ 自己写自己的八股!让未来的自己看懂! (全文手敲,受益良多) 网路基础3 网路层 TCP并没有把数据发到网路…

数据结构与算法学习导航

目录 指导思想资料总结代码随想录hello-algoOI-WIKI 一名麻瓜的刷leetcode的简单概述。 在这里对过去的自己说: 如果你相信算法有用你就刷刷leetcode,如果不相信面试会让你相信。 当然,现在我确实认为算法和数据结构有用,leetcode也有用。 …

【网络安全】谁入侵了我的调制解调器?(二)

文章目录 针对 TR-069 协议 REST API 的攻击思路攻击百万台调制解调器意外发现 Cox 后端 API 的授权绕过漏洞确认我们能够进入任何人的设备访问和更新任何Cox商业客户账户通过泄露的加密密钥覆盖任何人的设备设置执行对任何调制解调器的命令影响最后想说阅读本文前,请先行浏览…

大模型在急性单纯性阑尾炎预测及治疗方案制定中的应用研究

目录 一、引言 1.1 研究背景与意义 1.2 研究目的 1.3 研究方法与创新点 二、急性单纯性阑尾炎概述 2.1 定义与发病机制 2.2 临床表现 2.3 传统诊断方法 三、大模型在急性单纯性阑尾炎预测中的应用 3.1 大模型简介 3.2 数据收集与处理 3.3 模型训练与优化 3.4 预测…

Linux 上安装和配置 VNC 远程桌面

在 Linux 上安装和配置 VNC(Virtual Network Computing)可以让你远程访问图形化桌面环境。以下是详细的安装和配置步骤,适用于主流 Linux 发行版(如 Ubuntu、CentOS、Debian 等)。 1. 安装 VNC 服务器 Ubuntu/Debian …

《AI大模型应知应会100篇》第22篇:系统提示词(System Prompt)设计与优化

第22篇:系统提示词(System Prompt)设计与优化 摘要 在大语言模型(LLM)应用中,系统提示词(System Prompt)是控制模型行为的核心工具之一。它不仅定义了模型的身份、角色和行为规范,还直接影响输…

其他网页正常进入,但是CSDN进入之后排版混乱

显示不正常,排版混乱 解决方法: ①打开网络设置 ②更改适配器 ③所连接的网络 --右键 属性 然后就可以正常访问了。

Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑

视频讲解:Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑_哔哩哔哩_bilibili Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑 今天复现下Qwen2.5-VL玩玩 https://github.com/QwenLM/Qwen2.5-VL 创建conda环境,实测22.04&#x…

宫庭海:跨界融合与家国情怀的影视开拓者

从音乐经纪人到影视多面手的创业之路 近日,国内娱乐产业领军人物、著名音乐经纪人、制片人、影视投资人宫庭海先生再次受到广泛关注。凭借其卓越的成就和贡献,宫庭海先生在业界树立了良好的口碑和广泛的影响力。 宫庭海, 辽宁省大连市人&…

LeetCode算法题(Go语言实现)_51

题目 给你两个下标从 0 开始的整数数组 nums1 和 nums2 ,两者长度都是 n ,再给你一个正整数 k 。你必须从 nums1 中选一个长度为 k 的 子序列 对应的下标。 对于选择的下标 i0 ,i1 ,…, ik - 1 ,你的 分数 …