天气数据集-Jena Climate dataset

天气数据集-Jena Climate dataset

1.数据集基本信息

  • Dataset Name:  mpi_saale_2021b.csv  

  • Size: 26495 rows;  1 year (2021), 10 min  

  • 气象学、农业、环境科学

  • 开源机构:  Max Planck Institute for Biogeochemistry

2.数据特征

2.1 特征简介

  • 数据共有31个特征,包括一些地理测量数据,如气压、温度、湿度、降雨量、风向等等

  • 我们是希望通过各种测量数据预测气温,这里很多特征是类似的,比如不同高度下的温度就是彼此相似

2.2 特征可视化

因为这个数据随时间变化,我们直接画出数据各个特征随时间变化的趋势图, 这里用index作为x 轴:

2.3 数据特征细节

1. ‘Date Time', 日期和时间2. ‘p (mbar)',  大气压力(毫bar) 3. ’T (degC)',  温度(摄氏度)4. ‘rh (%)', relative_humidity 相对湿度 (%)5. ‘sh (g/kg)', 每千克空气中的水汽含量6. ‘Tpot (K)', 相当位温(以开尔文为单位)> 指在将大气气块压缩或扩张到参考压力下(通常为1000毫巴),使其在对流过程中不发生任何相变(即凝结或蒸发)的温度> 开尔文(Kelvin)是温度的国际单位,通常用于科学和工程领域。开尔文温度标度是绝对温度标度,以绝对零度(零度的-273.15摄氏度)作为零点。开尔文温度通常用符号 "K" 表示,不加摄氏度符号。因此,绝对零度为0K,而水的冰点是273.15K,水的沸点是373.15K。> 空气在湿度和压力保持恒定时的温度7. ‘Tdew (degC)', 露点温度(以摄氏度为单位)> 指空气在恒定压力下,通过降低温度使其饱和,产生露珠或霜的温度。简单来说,就是当空气中的水汽凝结成液态水或冰时的温度。露点温度通常用来描述空气中的湿度。当露点温度与空气温度相近时,空气的相对湿度较高;当它们之间的差距较大时,相对湿度较低。> 在气象学中,露点温度是一个重要的指标,用于衡量空气中的水汽含量以及空气的湿度。较高的露点温度意味着空气中含有较多的水汽,较低的露点温度则表示空气较为干燥。露点温度也是天气预报中的一个重要参数,因为它与空气中的水汽含量直接相关,对天气的变化和降水的可能性具有一定的预测意义。8. ‘VPmax (mbar)', 最大水汽压力(以毫巴为单位)> 在达到饱和状态时,液体表面的蒸汽压力达到最大值,此时液体中的分子以与气体中相同的速率从液体表面蒸发,并与气体中的分子再次凝结,这样就建立了动态平衡。9. ’VPact (mbar)', 实际水汽压力(以毫巴为单位)> 液体表面上的蒸汽与液体达到动态平衡时的压力。液体分子会不断从液体表面蒸发成气体,同时也会有气体分子再凝结成液体,当这两个过程达到平衡时,液体表面上就会有一定的蒸汽压。蒸汽压受温度和液体性质的影响,温度越高,蒸汽压越高;液体的性质(比如分子间力)也会影响蒸汽压的大小。10. ‘VPdef (mbar)', 水汽压力缺失(以毫巴为单位)> 际水汽压力与空气中饱和水汽压力之间的差值11. ‘H2OC (mmol/mol)', 水汽含量(以毫摩尔/毫摩尔为单位)12. ‘rho (g/m**3)', 空气密度(以克/立方米为单位)13. ‘wv (m/s)',  风速 (米/秒)> 强风可能伴随着暴风雨或暴风14. ‘wd (deg)',  风向(度)15. ‘rain (mm)',  降雨量(毫米)> 降水的数量,可用于判断是否下雨16. ‘SWDR (W/m**2)', 短波辐射(瓦特/平方米)> 短波辐射(Shortwave Downward Radiation)是指太阳短波辐射能量在大气层顶进入地面或水面的辐射能量。它是太阳能辐射的一部分,主要包括可见光和紫外光,通常以瓦特每平方米(W/m²)为单位表示。短波辐射是地球能量平衡中的一个重要组成部分,它决定了地球表面的能量收入。> 在气象学和气候学中,短波辐射是一个重要的气象参数,用于分析太阳辐射对地球能量平衡和气候变化的影响。它受到大气中云量、气溶胶、水汽含量等因素的影响,因此对于研究大气辐射传输和气候模拟具有重要意义。17. ‘SDUR (s)', 短波辐射持续时间(以秒为单位)18. ’TRAD (degC)', 地表温度(以摄氏度为单位)19. ‘Rn (W/m**2)',  净辐射(以瓦特/平方米为单位)20. ‘ST002 (degC)', 地表温度在 2 厘米深度的测量值(以摄氏度为单位)21. ’ST004 (degC)', 地表温度在 4 厘米深度的测量值(以摄氏度为单位)22. ‘ST008 (degC)', 地表温度在 8 厘米深度的测量值(以摄氏度为单位)23. ‘ST016 (degC)',  地表温度在 16 厘米深度的测量值(以摄氏度为单位)24. ’ST032 (degC)', 地表温度在 32 厘米深度的测量值(以摄氏度为单位)25. ’ST064 (degC)', 地表温度在 64 厘米深度的测量值(以摄氏度为单位)26. ‘ST128 (degC)', 地表温度在 128 厘米深度的测量值(以摄氏度为单位)27. ‘SM008 (%)', 土壤湿度在 8 厘米深度的测量值(以百分比表示)28. ‘SM016 (%)', 土壤湿度在 16 厘米深度的测量值(以百分比表示)29. ‘SM032 (%)', 土壤湿度在 32 厘米深度的测量值(以百分比表示)30. ’SM064 (%)', 土壤湿度在 64 厘米深度的测量值(以百分比表示)31. ‘SM128 (%)'   土壤湿度在 128 厘米深度的测量值(以百分比表示)

3.数据预处理

3.1 特征选择

- 由于顺序数据index和data性质类似,这里删掉 “Data Time”

- 由于ST002(degC)-ST064(degC)是不同地表高度的温度,和我们要预测的数据T(degC),在性质上类似,因此全部删掉

3.2 输入输出

我们计划用RNN模型来预测温度,大概是知道前n-1时刻的特征数据(包括温度),预测第n时刻的温度,因此:

我们要对shape为(26495,31)的数据进行处理。

  • 先删掉不需要的特征13个,剩下18个,删后的shape为(26495,18)

  • 我们用过8个连续时间点预测第9个时间点,即模型输入为 x = (_, 8, 18), 输出为 y = (_, 1)

> 这里的shape留了个空位给batch_size,用于模型批量化处理数据

  • 我们假设输出的参考真实值为标签y‘,即数据集中第三列特征

参考链接

  • LSTM 原版: Weather forecast using LSTM networks
  • 天气数据集:   Max-Planck-Institut fuer Biogeochemie - Wetterdaten

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/21031.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LabVIEW与欧陆温控表通讯的实现与应用:厂商软件与自主开发的优缺点

本文探讨了LabVIEW与欧陆温控表通讯的具体实现方法,并对比了使用厂商提供的软件与自行开发LabVIEW程序的优缺点。通过综合分析,帮助用户在实际应用中选择最适合的方案,实现高效、灵活的温控系统。 LabVIEW与欧陆温控表通讯的实现与应用&#…

派生类中调用基类的__init__()方法

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 在派生类中定义__init__()方法时,不会自动调用基类的__init__()方法。例如,定义一个Fruit类,在__init__()方法中创…

通过非欧几何体改变 AI 嵌入

目录 一、说明 二、LLM嵌入的形势 三、了解一些背景信息 3.1 什么是嵌入? 3.2 为什么嵌入在 NLP 中很重要? 3.3 复数Complex 几何的角色 3.4 C主动学习 3.5 角度嵌入 (AE):解锁稳健排序 3.6 RotatE:将关系…

day-37 最大正方形

思路 动态规划,这题主要得弄明白状态转换方程,dp[i][j]表示以(i,j)为右下角的最大正方形 解题方法 1.首先将第一行和第一列初始化,当对应位置的matrix为’0’时,dp数组对应位置也为零,否则为1 …

【工具】探索 DOU:每用户数据使用量

缘分让我们相遇乱世以外 命运却要我们危难中相爱 也许未来遥远在光年之外 我愿守候未知里为你等待 我没想到为了你我能疯狂到 山崩海啸没有你根本不想逃 我的大脑为了你已经疯狂到 脉搏心跳没有你根本不重要 🎵 邓紫棋《光年之外》 什么是 DOU…

重学java 55. 集合 Set接口

我救自己万万次,铮铮劲草,绝不动摇 —— 24.6.2 一、Set集合介绍 Set和Map密切相关的 Map的遍历需要先变成单列集合,只能变成set集合 二、HashSet集合的介绍和使用 1.概述 HashSet是Set接口的实现类 2.特点 a、元素唯一 b、元素无序 c、无索引…

开源VS闭源:大模型之争,究竟谁更胜一筹?

随着人工智能技术的快速发展,大模型作为其中的核心组件,已经引起了业界的广泛关注。在大模型的研发过程中,开源与闭源成为了两个备受争议的话题。究竟开源与闭源谁更好?本文将从多个角度进行深入分析,为大家揭示真相。…

重载运算符C++---学习笔记

一、笔记 1. 重载运算符基础知识 重载运算符进行的运算和普通数的加减运算不同之处在于重载运算符的操作数为一个一个自定义的对象,所以相应的要对普通的运算符如-*%/的调用方法进行重写,重载的本质还是函数调用 2. 重载运算符的语法 重载运算符的语…

Kubernetes-使用集群CA证书给用户颁发客户端证书访问Api-Server

一、官网地址 证书和证书签名请求 | Kubernetes 二、Demo 一、创建测试文件夹 cd ~ mkdir add_k8s_user_demo cd add_k8s_user_demo 二、创建符合X509标准的证书 openssl genrsa -out myuser.key 2048 openssl req -new -key myuser.key -out myuser.csr -subj "/CNmy…

自动微分技术在 AI for science 中的应用

本文简记我在学习自动微分相关技术时遇到的知识点。 反向传播和自动微分 以 NN 为代表的深度学习技术展现出了强大的参数拟合能力,人们通过堆叠固定的 layer 就能轻松设计出满足要求的参数拟合器。 例如,大部分图神经网络均基于消息传递的架构。在推理…

带交互的卡尔曼滤滤波|一维滤波|源代码

背景 一维卡尔曼滤波的MATLAB例程,​背景为温度估计。 代码介绍 运行程序后,可以自己输入温度真实值: 以20℃为例,得到如下的估计值​: 滤波前的值和滤波后的值分别于期望值(真实值)作差…

基于Jenkins+Kubernetes+GitLab+Harbor构建CICD平台

1. 实验环境 1.1 k8s环境 1)Kubernetes 集群版本是 1.20.6 2)k8s控制节点: IP:192.168.140.130 主机名:k8s-master 配置:4C6G 3)k8s工作节点 节点1: IP:192.1…

【机器学习】基于OpenCV和TensorFlow的MobileNetV2模型的物种识别与个体相似度分析

在计算机视觉领域,物种识别和图像相似度比较是两个重要的研究方向。本文通过结合深度学习和图像处理技术,基于OpenCV和TensorFlow的MobileNetV2的预训练模型模,实现物种识别和个体相似度分析。本文详细介绍该实验过程并提供相关代码。 一、名…

JVM运行时数据区 - 程序计数器

运行时数据区 Java虚拟机在执行Java程序的过程中,会把它管理的内存划分成若干个不同的区域,这些区域有各自的用途、创建及销毁时间,有些区域随着虚拟机的启动一直存在,有些区域则随着用户线程的启动和结束而建立和销毁&#xff0…

前端组件业务数据选择功能优雅写法

1. 业务场景 后台管理在实际业务中,经常可见的功能为:在当前的页面中从其他列表中选择数据。 例如,在一个商品活动列表页面中 需要选择配置的商品。 2. 遇到问题 从代码划分的角度来说,每个业务列表代码首先分散开来&#xff0…

LeetCode刷题之HOT100之在排序数组中查找元素的第一个和最后一个位置

下午雨变小了,但我并未去实验室,难得的一天呆在宿舍。有些无聊,看看这个,弄弄那个,听听歌,消磨时间。不知觉中时间指针蹦到了九点,做题啦!朋友推荐了 Eason 的 2010-DUO 演唱会&…

2024年06月数据库流行度最新排名

点击查看最新数据库流行度最新排名(每月更新) 2024年06月数据库流行度最新排名 TOP DB顶级数据库索引是通过分析在谷歌上搜索数据库名称的频率来创建的 一个数据库被搜索的次数越多,这个数据库就被认为越受欢迎。这是一个领先指标。原始数…

低代码是什么?开发系统更有什么优势?

低代码(Low-Code)是一种应用开发方法,它采用图形化界面和预构建的模块,使得开发者能够通过少量的手动编程来快速创建应用程序。这种方法显著减少了传统软件开发中的手动编码量,提高了开发效率,降低了技术门…

thingsboard物联网平台快速入门教程

第一步,搭建服务器 使用我已经建好的服务器,thingsboard测试账号,租户管理员账号,物联网测试平台-CSDN博客 第二步,创建一个设备,获取设备Token 用租户管理员账户登录,左侧找到实体->设备&#xff0c…

Oracle导出clob字段到csv

使用UTL_FILE ref: How to Export The Table with a CLOB Column Into a CSV File using UTL_FILE ?(Doc ID 1967617.1) --preapre data CREATE TABLE TESTCLOB(ID NUMBER, MYCLOB1 CLOB, MYCLOB2 CLOB ); INSERT INTO TESTCLOB(ID,MYCLOB1,MYCLOB2) VALUES(1,Sample row 11…