谷歌科技近日公布了一项震撼业界的天气预报研究成果,这一成果不仅标志着天气预测技术的重大突破,更是人工智能技术在传统领域应用的又一里程碑。他们成功研发了名为SEEDS(Scalable Ensemble Envelope Diffusion Sampler)的新型预报模型,该模型采用了前所未有的机率扩散模型技术,这一技术原本被广泛应用于艺术作品的创作和全新图片的生成。
SEEDS详细报道:Generative AI to quantify uncertainty in weather forecasting
更多消息:
AI人工智能行业动态,aigc应用领域资讯在这个瞬息万变的AI时代,每天都涌现出无数资讯,在这里会以日更方式,整理国内外热门AI动态讯息分享给大家。https://heehel.com/category/ai-news
SEEDS模型之所以强大,在于其独特的机率扩散机制。该模型首先通过逐步添加噪声来模拟数据的模糊化过程,直至数据完全随机化;随后,它又能逆转这一过程,通过逐步去除噪声,重新恢复或创造出全新的数据。这种机制赋予了SEEDS模型极高的不确定性和多样性,使其成为生成复杂多变数据的强大工具。
在天气预报领域,SEEDS模型展现出了非凡的能力。它能够从有限的初始预测数据出发,生成一系列反映未来天气多样性和不确定性的预报方案。这对于捕捉天气系统的混沌特性至关重要,因为即使是微小的初始条件变化,也可能引发未来天气的巨大变化。而传统的单一预测方法往往难以准确反映这种不确定性。
SEEDS模型的另一大优势在于其高效性和低成本性。与需要高昂成本和高性能计算资源的传统模型相比,SEEDS能够在极短的时间内生成大量预报数据,大大提高了预报的频率和准确性。这对于提高天气预报的实时性和有效性具有重要意义。
此外,SEEDS模型的应用潜力远不止于天气预报。它还可以为气候风险评估提供新的方法和工具,帮助科学家更准确地量化和理解未来气候的不确定性。因此,SEEDS不仅是天气预报领域的一次重大创新,也是人工智能技术在传统科学研究领域应用的典范。
SEEDS:人工智能驱动的进步
SEEDS 可以根据运行数值天气预报系统的一到两次预报生成大型集合。生成的集成不仅能产生可信的类似真实天气的预测,而且在排名直方图、均方根误差 (RMSE) 和连续排名概率得分 (CRPS) 等技能指标方面匹配或超过基于物理的集成)。特别是,生成的集合为预测分布的尾部分配了更准确的可能性,例如 ±2σ 和 ±3σ 天气事件。最重要的是,与超级计算机进行预测所需的计算时间相比,该模型的计算成本可以忽略不计。它在 Google Cloud TPUv3-32 实例上每 3 分钟具有 256 个集成成员(分辨率为 2°)的吞吐量,并且可以通过部署更多加速器轻松扩展到更高的吞吐量。
生成合理的天气预报
众所周知,生成式人工智能可以生成非常详细的图像和视频。此属性对于生成与可能的天气模式一致的集合预报特别有用,这最终为下游应用带来最大的附加值。正如 Lorenz 指出的那样,“他们制作的[天气预报]地图应该看起来像真实的天气地图。”下图将 SEEDS 的预测与美国正在运行的天气预报系统(全球集合预报系统,GEFS)的预测进行了对比。我们还将结果与高斯模型的预测进行了比较,该模型预测每个地点每个大气场的单变量平均值和标准差,这是一种常见且计算效率高但不太复杂的数据驱动方法。该高斯模型旨在表征逐点后处理的输出,它忽略相关性并将每个网格点视为独立的随机变量,相比之下,真实的天气图将具有详细的相关结构。
由于SEEDS直接模拟大气状态的联合分布,因此它真实地捕捉了对流层中位势与平均海平面压力之间的空间协方差和相关性,两者密切相关,常被天气预报员用于评估和验证的预测。平均海平面压力的梯度是驱动地表风的因素,而对流层中部位势的梯度则产生高层风,从而改变大规模的天气模式。
下图所示的 SEEDS 生成的样本(框架 Ca-Ch)显示了葡萄牙西部的一个位势槽,其空间结构与美国实际预测或基于观测的再分析中发现的空间结构相似。尽管高斯模型可以充分预测边缘单变量分布,但它无法捕获跨领域或空间相关性。这阻碍了对这些异常现象对来自北非的热空气入侵可能产生的影响的评估,而北非的热空气入侵可能会加剧欧洲的热浪。
更准确地报道极端事件
下面我们展示了2022年7月14日当地时间1:00的极端高温事件期间里斯本附近2米处的温度和总水汽柱的联合分布。我们使用 2022 年 7 月 7 日发布的 7 天预测。对于每个图,我们使用 SEEDS 生成 16,384 个成员的集合。 ERA5 观测到的天气事件用星号表示。还显示了操作系综,其中正方形表示用于为生成的系综提供种子的预测,三角形表示其余系综成员。
据美国行动小组称,7 天前观察到的事件发生的可能性非常小,以至于其 31 名成员都没有预测到近地表温度会像观察到的那样温暖。事实上,根据高斯核密度估计计算出的事件概率低于 1%,这意味着成员少于 100 人的集合不太可能包含像此事件一样极端的预测。相比之下,SEEDS 集合能够从两个播种预测中进行推断,提供可能的天气状态的范围,并更好地统计事件的覆盖范围。这样既可以量化事件发生的概率,又可以对事件发生的天气状况进行采样。具体来说,我们高度可扩展的生成方法可以创建非常大的集合,通过为任何用户定义的诊断提供超过给定阈值的天气状态样本来表征非常罕见的事件。
结论和未来展望
SEEDS 利用生成式人工智能的力量来生成与美国正在运行的预报系统相当的集合预报,但速度更快。本文报告的结果只需要来自操作系统的 2 个播种预测,该系统在当前版本中生成 31 个预测。这导致了一种混合预报系统,其中使用基于物理的模型计算的一些天气轨迹来播种扩散模型,该模型可以更有效地生成额外的预报。这种方法提供了当前操作天气预报范例的替代方案,其中统计模拟器节省的计算资源可以分配用于提高基于物理的模型的分辨率或更频繁地发布预报。
我们相信,SEEDS 只是人工智能在未来几年加速数值天气预报业务进展的众多方式之一。我们希望这一生成式人工智能在天气预报模拟和后处理方面的实用性演示将促进其在气候风险评估等研究领域的应用,在这些领域中,生成大量气候预测集合对于准确量化未来的不确定性至关重要气候。