AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora

编者按:气候变化日益加剧,高温、洪水、干旱,频率和强度不断增加的全球极端天气给整个人类社会都带来了难以估计的影响。这给现有的天气预测模型提出了更高的要求——这些模型要更准确地预测极端天气变化,为政府、企业和公众提供更可靠的信息,以便做出及时的准备和响应。为了应对这一挑战,微软研究院开发了首个大规模大气基础模型 Aurora,其超高的预测准确率、效率及计算速度,实现了目前最先进天气预测系统性能的显著提升。Aurora 不仅在预测技术上取得了重大突破,更在应用层面展现出了巨大潜力。


aurora-1

2023年11月,风暴“夏兰”席卷了欧洲西北部,造成了严重破坏,伴随而来的低压系统刷新了英格兰的记录,成为极为罕见的气象事件。这场风暴的猛烈程度让许多人措手不及,在暴露当前天气预测模型不足的同时,也凸显了气候变化日益加剧的情况下,提升气候预测准确性的迫切需求。我们如何才能更好地预测此类极端天气事件,并做好更为充分的准备?

Charlton-Perez 等人(2024年)近期的一项研究指出,即便是目前最先进的人工智能天气预测模型,在准确捕捉风暴“夏兰”的快速增强过程及其峰值风速方面也面临着挑战。为应对这些挑战,微软研究院开发了先进的人工智能基础模型 Aurora,可以从海量的大气数据中洞察到有价值的信息。Aurora 所展示出的创新天气预测方法,有望显著提升人们预测并减轻极端天气事件影响的能力,包括对风暴“夏兰”这类恶劣天气事件的急剧恶化进行预测。

Aurora 论文:Aurora: A Foundation Model of the Atmosphere

灵活的大气三维基础模型

Aurora 的有效性在于它经过了超一百万小时的多样化天气和气候模拟的训练,能够全面了解大气动力学。这使得该模型在广泛的预测任务中都表现出色,即使在数据稀疏的地区或极端天气的情况下也能如此。通过以0.1°(赤道处约11公里)的高空间分辨率运行,Aurora 可以捕捉大气过程的复杂细节,提供比以往更准确的预报,而且其计算成本仅为传统数值天气预报系统的一小部分。据估计,Aurora 相较于最先进的数值预报系统(Integrated Forecasting System, IFS)可提升约5000倍的计算速度。

Aurora 不仅拥有极高的预报准确性和效率,还具有多功能性,可以预测各种大气变量,从温度和风速到空气污染水平和温室气体浓度。Aurora 的架构旨在处理异构的黄金标准输入,并以不同的分辨率和保真度生成预测。该模型由一个灵活的 3D Swin Transformer 和基于 Perceiver 的编码器和解码器组成,使其能够处理和预测一系列跨空间和压力水平的大气变量。通过对大量多样化数据进行预训练并针对特定任务进行微调,Aurora 学会了捕捉大气中的复杂模式和结构,即使在有限的训练数据下对特定任务进行微调时,它仍然能有出色的表现。

图1:Aurora 架构

图1:Aurora 架构

大气化学和空气污染的快速预测

Aurora 多功能性的一个典型例子是其能够利用哥白尼大气监测服务(CAMS)的数据预测空气污染水平。这是一项众所周知的艰巨任务,因为大气化学、天气模式和人类活动之间复杂的相互作用,以及 CAMS 数据的高度异构性。通过利用灵活的编码器-解码器架构和注意力机制,Aurora 可以有效处理并学习这些具有挑战性的数据,捕捉空气污染物的独特特征及其与气象变量的关系。这使得 Aurora 能够在0.4°的空间分辨率下生成精确的五天全球空气污染预报,并在所有目标的74%中超越了最先进的大气化学模拟,从而证明了 Aurora 在解决各种环境预测问题方面的高度适应性和巨大潜力,即使在数据稀缺或高度复杂的情况下也是如此。

aurora-3-1

图2:Aurora 在许多目标上的表现都优于现行的 CAMS:(a) Aurora 对二氧化氮柱总量的样本预测与 CAMS 的分析比较;(b) Aurora 相对于 CAMS 的纬度加权均方根误差(RMSE),负值(蓝色)表示 Aurora 的表现更佳

图2:Aurora 在许多目标上的表现都优于现行的 CAMS:(a) Aurora 对二氧化氮柱总量的样本预测与 CAMS 的分析比较;(b) Aurora 相对于 CAMS 的纬度加权均方根误差(RMSE),负值(蓝色)表示 Aurora 的表现更佳

利用数据多样性与模型缩放改善大气预测

该研究的主要发现之一是,与在单一数据集上的训练相比,在多样化的数据集上进行预训练可以显著提升 Aurora 的性能。通过整合气候模拟、再分析产品及业务预报的数据,Aurora 能够学习到更强大、更通用的大气动力学表征。得益于庞大的规模和多样化的预训练数据,Aurora 可以在各种任务和分辨率上,超越目前最先进的数值天气预报模型和专业的深度学习方法。

aurora-4-1

aurora-4-2

图3:在不同数据上进行预训练并扩大模型规模均有助于提升性能

图3:在不同数据上进行预训练并扩大模型规模均有助于提升性能

Aurora 模型的规模化直接带来了在架构设计、训练数据语料库以及预训练和微调协议方面的性能优势,使得 Aurora 的性能超过了现有的专业深度学习模型。为进一步验证在多个数据集上预训练大模型的优势,研究员们将 Aurora 与 GraphCast 进行了比较,后者仅在 ERA5 上进行了预训练,并被认为是分辨率为0.25°、交付时间长达五天的最先进的人工智能模型。此外,研究员们还将 IFS HRES(数值天气预报的黄金标准)也纳入了比较范围。结果表明,无论是在与气象分析、气象站观测数据还是极端值的对比中,Aurora 的表现均优于 GraphCast 和 IFS HRES。

aurora-5-1

aurora-5-2

图4:在绝大多数目标上,Aurora 的性能都优于现行的 GraphCast 和 HRES。在每幅图中,中心线右侧的值代表高于阈值的累积均方根误差,左侧的值表示低于阈值的累积均方根误差。

图4:在绝大多数目标上,Aurora 的性能都优于现行的 GraphCast 和 HRES。在每幅图中,中心线右侧的值代表高于阈值的累积均方根误差,左侧的值表示低于阈值的累积均方根误差。

地球系统建模的范式转变

Aurora 的影响力远不止于大气预报领域。通过展示基础模型在地球科学中的潜力,该研究为开发覆盖整个地球系统的综合模型奠定了基础。基础模型可以在数据稀缺的情况下出色地完成下游任务,有望使得在数据稀缺地区(例如发展中国家和极地地区)的民众也能够更加平等地获取准确的天气和气候信息。同时,这一进展也将对农业、交通、能源开发以及灾害应对等多个领域产生深远影响,让人们能够更好地适应气候变化带来的挑战。

随着人工智能在环境预测领域的不断进步,微软研究院希望 Aurora 能够成为未来研究和发展的新范式。该研究强调了多样化预训练数据集、模型扩展和灵活架构在构建地球科学强大的基础模型时的重要性。随着计算资源和数据可用性的不断进步,可以预见,未来像 Aurora 这样的基础模型将成为天气和气候领域预测系统的核心,为全球决策者和公众提供及时、准确和可操作的洞见。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/859704.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【转】5种常见的网络钓鱼攻击以及防护手段

2022 年 Verizon 数据泄露调查报告指出,去年 75% 的社会工程攻击涉及网络钓鱼,仅去年一年就有超过 33 万个账户被网络钓鱼,网络钓鱼占整体社会工程攻击的 41%。 不能将所有责任归咎于员工,因为薄弱的安全意识建设及宣教是大部分漏…

XSS跨站攻击漏洞

XSS跨站攻击漏洞 一 概述 1 XSS概述 xss全称为:Cross Site Scripting,指跨站攻击脚本,XSS漏洞发生在前端,攻击的是浏览器的解析引擎,XSS就是让攻击者的JavaScript代码在受害者的浏览器上执行。 XSS攻击者的目的就是…

Windows 中 Chrome / Edge / Firefox 浏览器书签文件默认存储路径

1. Chrome 浏览器 按组合键 Win R,打开运行对话框,输入 %USERPROFILE%\AppData\Local\Google\Chrome\User Data\Default或在Chrome 浏览器地址栏输入 chrome://version查看【个人资料路径】 2. Edge 浏览器 按组合键 Win R,打开运行对…

GD32F4xx 移植agile_modbus软件包与电能表通信

目录 1. agile_modbus1.1 简介1.2 下载2. agile_modbus使用2.1 源码目录2.2 移植3. 通信调试3.1 代码3.3 通信测试1. agile_modbus 1.1 简介 agile_modbus是一个轻量级的Modbus协议栈,主要特点: 支持RTU和TCP协议,采用纯C语言开发,不涉及任何硬件接口,可直接在任何形式的…

Java流程控制语句

Java流程控制语句有三种: 顺序结构、分支结构和循环结构。 顺序结构: 顺序结构语句是Java程序默认的执行流程,按照代码的先后顺序,从上到下依次执行。 原文链接: Java流程控制控制语句 - 红客网络编程与渗透技术 示例…

查看es p12证书文件过期方法

查看证书过期时间: openssl pkcs12 -in elastic-certificates.p12 -nokeys -out elastic-certificates.crt (需要输入证书生成时配置密码) openssl x509 -enddate -noout -in elastic-certificates.crt

乐鑫云方案研讨会回顾|ESP RainMaker® 引领创业潮,赋能科创企业

近日,乐鑫信息科技 (688018.SH) ESP RainMaker 云生态方案线下研讨会和技术沙龙在深圳成功举办,吸引了众多来自照明电工、新能源、安防、宠物等垂类领域的客户与合作伙伴。活动现场,与会嘉宾围绕产品研发、测试认证、品牌构建、跨境电商等多维…

【面试题】什么是等保2.0?

等保2.0,全称网络安全等级保护2.0制度,是我国网络安全领域的基本国策和基本制度,旨在加强网络系统的安全保护,确保关键信息不被泄露、篡改、破坏或丧失。以下是关于等保2.0的详细介绍: 实施时间与背景: 等…

新加坡经济是如何腾飞的?How Singapore Got So Crazy Rich

How Singapore Got So Crazy Rich Link: https://www.youtube.com/watch?vYSMWN8VpY6A Summary Singapore, a small island nation, has become Asia’s wealthiest country and one of the richest in the world. With a GDP per capita surpassing countries like the UK,…

matlab中函数meshgrid

(1) 二维网格 [X,Y] meshgrid(x,y) 基于向量 x 和 y 中包含的坐标返回二维网格坐标。X 是一个矩阵,每一行是 x 的一个副本;Y 也是一个矩阵,每一列是 y 的一个副本。坐标 X 和 Y 表示的网格有 length(y) 个行和 length(x) 个列。 x 1:3; y…

AWS WAF 中的验证码和挑战 | 网页抓取时如何解决这个问题

正如许多企业或爬虫用户所知,AWS WAF(Web 应用防火墙)是一个强大的安全解决方案,旨在保护 Web 应用免受常见的网络攻击和漏洞。其关键功能之一是使用 CAPTCHA 和挑战来区分合法用户和潜在的恶意机器人。虽然这增强了安全性&#x…

[C++]24:异常和智能指针

异常和智能指针 一.异常1.C/C的错误:1.C2.C3.三个关键字: 2.使用异常:1.基本概念:2.基本代码:1.基本使用:2.多个捕获:3.任意类型异常的捕获:4.异常的重新抛出: 3.异常安全…

微软将停用 App Center:React Native 开发人员应该使用以下工具

再见,应用中心!你好,EAS + Sentry + GitHub Actions! React Native 开发人员大遗憾:微软宣布将于 2025 年 3 月 31 日关闭Visual Studio App Center。 多年来, Infinite Red一直将 App Center 作为许多 React Native 咨询客户的 CI/CD 流程和开发工作流程的关键部分。它有…

License简介和Licensecc的使用

License简介和Licensecc的使用 License简介什么是LIcense简易License制作加密扫盲对称加密非对称加密 Licensecc使用构建和编译在linux上进行编译UbuntuCentOS 7CentOS 8下载并编译配置编译和测试cmake 后可以跟的参数在Linux上为Windows进行交叉编译 在windos上进行编译MSVC (…

项目管理软件如何帮助收尾项目?

项目规划、执行、监测和控制通常是项目管理的重点。即使是项目启动也会受到关注,但项目收尾通常是事后才提及的。 实际上,项目的每个阶段都很重要。项目收尾不仅仅是按时交付、不超预算和达到预期质量。 什么是项目收尾? 项目收尾是项目生…

elementUI的衍生组件,avue的crud表格错位问题

问题描述: 每次从别的页面跳转回来就发现表格显示错位了 一通查 结果发现是有两层表格 解决办法: 根据开发者工具中看到的样式选择器,很粗暴的在全局样式文件中加一个: 效果:

学习记录696@网络安全之认证、报文完整性、密钥分发与证书

认证 即通信双方如何认证对方身份。 这种情况存在问题:trudy可以伪造A的IP地址。就算带上密码也可能被截获,用于重放攻击。 解决重放攻击的办法是随机数挑战,每次认证时,B都发一个挑战码给A。A加密后再传给B,如果B…

恒远世达:把握现在,高考后逆袭,开启日本留学之路!

一年一度的高考已经落幕,马上就要出高考分数了,有人欢喜有人忧,奋斗学习了这么多年,就为了考上一所理想的大学,一旦没考上,心情会非常的低落。 在传统心态中,高考失利意味着人生重大失败&#…

基于自主发明专利的杰林码哈希算法、对称加密算法和无损压缩算法的可文件追踪管控且支持linux和windows的文件压缩包工具SDK和JLM PACK软件介绍

基于自主发明专利的杰林码哈希算法、对称加密算法和无损压缩算法的可文件追踪管控且支持linux和windows的文件压缩包工具SDK1.0版发布,下载链接为: JLM PACK CSDN下载链接 JLM PACK SDK和软件的官方网站 注意测试授权证书yesine_jlmpack_test.license…

一种改进解卷积算法在旋转机械故障诊断中的应用(MATLAB)

轴承振动是随机振动。在不同的时刻,轴承振动值是不尽相同的,不能用一个确定的时间函数来描述。这是由于滚动体除了有绕轴承公转运动以外,还有绕自身轴线的自旋运动,且在轴承运转时,滚动接触表面形貌是不断变化的&#…