ProbTS:时间序列预测的统一评测框架

编者按:如今,时间序列预测在健康、能源、商业、气候等多个行业发挥着至关重要的作用。它不仅影响着相关资源的分配和调度,还影响着行业的管理和运营决策。但是现有的时间序列预测方法通常缺乏对基础预测需求的全面考虑,无论是经典的时序预测模型还是近期涌现的时序基础模型,都存在方法设计上的“偏见”。

为此,微软亚洲研究院的研究员们联合香港科技大学(广州)和清华大学的科研人员合作开发了 ProbTS 框架,希望对现有时序预测模型进行统一的基准评测。在 ProbTS 框架下,研究员们通过在点估计/分布估计、长程/短程、自回归/非自回归等多维度上的预测效果比较,揭示了各模型在关键方法论上的“抉择”难题和差异,并对各模型进行了全面的优劣势辨析。ProbTS 的分析结果可以帮助业界反思当前时间序列预测模型在底层方法论上遭遇的挑战,更重要的是为未来预测模型的发展梳理出了更加清晰的研究方向。


时间序列预测(Time-series Forecasting)对众多行业都至关重要,包括健康、能源、商业、气候等。在不同预测长度上的准确性,对这些领域中服务短期和长期的规划和决策需求来说极其重要。例如,在疫情爆发这种公共卫生的紧急情况下,预测一到四周内的感染病例和死亡人数对于有效分配医疗和社会资源非常重要。在能源领域,准确预测每小时、每天、每周甚至每月的电力需求也对电网管理和可再生能源调度十分关键。同样,在物流行业,准确预测短期和长期的货物量能有效帮助企业合理安排运输路线以及高效管理供应链。

除了涵盖各种预测长度,面向规划和决策的精准预测不仅要考虑到点估计(Point Estimation),更要支持分布估计(Distribution Estimation),以衡量估计的不确定性。因为期望下的预测值及其相关的不确定性可以为随后的规划和优化提供一个全面的视角来引导更好的决策。

鉴于不同预测长度对点预测和分布预测的迫切需求,来自微软亚洲研究院的研究员们对现有不同研究领域开发的最先进的模型进行了回顾,这些模型包括:

  • 经典时间序列模型:这些模型通常需要在每个数据集上从头开始训练,包括专门用于长程点预测(例如,PatchTST、iTransformer)以及专注于短程分布预测的方法(例如,CSDI、TimeGrad)。
  • 近期的时间序列基础模型:这些模型涉及在广泛的时间序列数据集上进行通用预训练,包括由工业实验室(例如,TimesFM、MOIRAI、Chronos)和学术机构(例如,Timer、UniTS)开发的方法。

研究员们发现,尽管目前的预测模型有着可观的进展,但现有的方法通常缺乏对基础预测需求的全面考虑。这种局限性将导致现有模型方法在设计上存在“偏见”,而且这些模型能力尚未在更广泛的预测场景中得到验证。

基于此,研究员们开发了 ProbTS 框架。ProbTS 是一个统一的基准评测框架,旨在评估当前方法在满足基本预测需求方面的表现。研究员们通过 ProbTS 工具,不仅对预测研究的关键方法论差异进行了探讨,还对各类时间序列预测的经典模型和基础模型进行了评测,揭示了现有时间序列预测研究中存在的问题,以及各模型的优劣势所在,进而对该领域未来的研究方向进行了梳理。

ProbTS: Benchmarking Point and Distributional Forecasting across Diverse Prediction Horizons

论文链接:https://arxiv.org/abs/2310.07446v4

GitHub链接:https://github.com/microsoft/ProbTS

范式差异:时间序列预测的方法论辨析

研究员们通过 ProbTS 进行的基准研究发现,目前的时间序列预测关键方法论存在两方面的差异——点估计和分布估计的预测范式,以及多步预测的解码方案。

点估计和分布估计的预测范式:

  • 点预测:只支持点预测的方法,提供预期估计值而不进行不确定性量化。
  • 预定义的分布函数预测头:使用预定义的分布函数预测头生成分布预测的方法,提供了一定的不确定估计,但缺乏对复杂数据分布的建模能力。
  • 神经分布估计模块:采用基于神经网络的模块来估计数据分布,允许更灵活且可能更准确的不确定性量化。

多步预测输出的解码方案:

  • 自回归(Autoregressive,简称 AR)方法:这些方法逐步生成预测,使用先前的预测作为未来时间步的输入,适用于序列依赖性至关重要的场景。
  • 非自回归(Non-autoregressive,简称 NAR)方法:这些方法同时为所有时间步生成预测,提供更快的预测速度,并且可能在长程预测中表现更好。

图1:ProbTS 概览,展示了其在不同预测场景中的覆盖范围,包括不同研究分支中开发的典型模型和全面的评估指标。

图1:ProbTS 概览,展示了其在不同预测场景中的覆盖范围,包括不同研究分支中开发的典型模型和全面的评估指标。

在 ProbTS 框架下的研究结果显示:首先,在长程及短程预测中,长程点预测的方法因定制化的神经架构在长程场景中表现出色,但在短程案例和复杂数据分布中表现不佳,并且因为缺乏对预测不确定性的量化评估,导致其与概率模型相比在应对复杂数据分布情况下存在显著的性能差距。而短程概率预测方法仅在短程分布预测方面表现专业,但在长程预测场景中就会出现性能下降以及计算效率的问题。

其次,针对解码器设计,长程点预测模型主要采用非自回归解码,而在短程概率预测模型设计中则没有出现这种偏向性。并且,尽管自回归解码在长程预测中容易受到误差累积的影响,但在具有强周期性模式的场景下可能表现更好。

最后,在当前涌现的时间序列基础模型中,部分采用自回归解码的基础模型在长程预测中同样面临误差累积的挑战,且尚未有较好的应对措施。同时,当前基础模型对分布预测的支持有限,突显了提升复杂数据分布建模能力的需求。

经典时间序列模型的评测结果与分析

研究员们使用 ProbTS 框架对广泛的预测场景中的各种经典时间序列模型进行了基准评测,涵盖短程和长程预测。具体评测指标包括点预测指标 NMAE (Normalized Mean Absolute Error) 和分布预测指标 CRPS (Continuous Ranked Probability Score)。此外,研究员们还通过计算一种非高斯性的评分,量化了每个预测场景中数据分布的复杂性。

根据 ProbTS 的评测结果,研究员们发现:

  • 长程点预测模型的局限性:针对长程点预测所设计的时间序列神经架构,在长程场景中表现出色,然而,它们在短程预测任务中的架构优势显著降低(见图2(a)和2(c))。而且,这些模型无法衡量预测的不确定性,导致其与概率模型相比在分布预测上存在更大的性能差距。这一差距在数据分布复杂时会更加显著(见图2(c)和2(d))。
  • 短程概率预测模型的弱点:当前的概率预测模型虽然在短程分布预测方面表现出色,但在长程场景中面临挑战,表现为显著的性能下降(见图2(a)和2(b))。此外,随着预测长度的增加,一些模型会遭受严重的计算效率问题(详情请参见论文)。

图2:使用 ProbTS 对经典时间序列模型进行基准评测

图2:使用 ProbTS 对经典时间序列模型进行基准评测

这些观察结果表明,当前已有的预测模型中仍然缺乏适合短程预测的有效架构设计;另外刻画复杂数据分布的能力对于这些预测模型的能力而言及其重要。同时,目前的长程分布预测在性能和效率方面都面临着重大挑战。

随后,研究员们在各种预测场景中比较了自回归(AR)和非自回归(NAR)解码方案,以突出它们在预测长度,以及面对不同趋势性和周期性时序数据方面的优势与劣势。

图3:使用 ProbTS 比较自回归和非自回归解码方案

图3:使用 ProbTS 比较自回归和非自回归解码方案

研究员们发现,目前几乎所有的长程点预测模型都在使用非自回归解码方案进行多步预测输出,而概率预测模型则更平衡地使用自回归和非自回归方案。从数据特性视角出发,两种方案的差异可能源于:

  • 预测长度影响:图3(a)显示,随着预测长度的增加,AR 解码与 NAR 方法相比表现出更大的性能差距,表明 AR 可能受到错误累积的影响。
  • 趋势性强度影响:图3(b)将性能差距与趋势性的强度联系起来,表明强烈的趋势效应可能导致 NAR 和 AR 模型之间的显著性能差异。当然也存在例外情况,即使趋势性强,基于 AR 的模型也未必出现大幅度性能下降。
  • 周期性强度影响:图3(c)通过引入周期性强度作为另一个因素来解释这些例外。令人惊讶的是,基于 AR 的模型在具有强周期性模式的场景中表现更好,这很可能是由于它们在这种情况下具有更高的参数效率。
  • 趋势性和周期性的综合影响:图3(d)展示了趋势性和周期性对性能差异的综合影响。

基于此,研究员们指出,不同研究分支选择 AR 和 NAR 解码方案主要是由它们所关注的预测场景中特定的数据特性所驱动的,这也解释了大多数长期预测模型对 NAR 解码范式的偏好。然而,这种对 NAR 的偏好可能忽略了 AR 的优势,特别是 AR 在处理强周期性方面的有效性。由于 NAR 和 AR 各自拥有独特的优势,未来的研究可以探索两者的平衡之道,并改善它们的弱点。

时间序列基础模型的评测结果与分析

研究员们还使用 ProbTS 框架将分析扩展到最新涌现的时间序列基础模型上(参见图4),不仅评估了这些模型在各种预测长度内的表现,还检验了它们的分布预测能力。

图4:使用 ProbTS 进行时间序列基础模型评测

图4:使用 ProbTS 进行时间序列基础模型评测

评测结果表明:

  • AR 解码在扩展预测长度时存在局限性(图4(a)),这可能是由于时间序列具有数值连续的特性,与语言建模中 AR 方法操作在离散空间中的情况不同,AR 解码方法在时序预测上会遇到更加严重的误差累积问题。
  • AR 和 NAR 模型在短程场景中可以提供相当的性能,有时基于AR的模型甚至会优于它们的 NAR 对手。
  • 当前的基础模型在分布预测方面支持有限,通常使用预定义的分布预测函数(例如:MOIRAI)或在值量化空间中用离散分布来近似建模(例如:Chronos)。这一点可以通过其与经典概率模型 CSDI 在比较捕捉复杂数据效果时发现(图4(b))

总而言之,虽然当前基于 AR 的基础模型在短程场景中表现优异,但它们的性能在面临更长的预测长度时显著降低,这表明时间序列数据预测,尤其在长程预测场景中,需要独特的处理来优化 AR 解码。同时,上述研究再次证明了准确刻画复杂数据分布的能力仍然是时间序列基础模型中亟需提升的关键领域。

未来方向:视角、模型和工具的三重更新

基于对现有方法的评测与分析,研究员们提出了在时间序列预测模型领域未来最重要的若干研究方向,在这些方向上的深入探索将会对各个行业的关键预测场景产生重大影响。

方向1:采用全面视角。研究员们指出,在开发新模型时有必要采用全面的视角审视前述的核心预测需求。这将帮助我们重新思考不同模型的方法选择,迭代它们的优势和劣势,并促进更多样化的研究探索。

方向2:创建通用模型。ProbTS 的研究引发了一个基本问题,即能否开发出一个满足所有核心预测需求的通用模型?或者是否应该分别处理不同的预测需求,为每种需求引入特定技术?

研究员们认为,虽然很难给出一个明确的答案,但当前的发展趋势可能倾向于创建一个通用模型。在设计该模型时,需要考虑输入表示、编码架构、解码方案和分布估计模块等问题。此外,未来还需要研究该通用模型如何应对高维数据和嘈杂场景中的分布预测(特别是对于长程预测),并探索如何利用 AR 和 NAR 解码方案的不同优势,同时规避它们各自的弱点。

方向3:开发研究工具。未来应进一步加强对相关研究工具的开发。目前研究中使用的 ProbTS 框架已经开源,研究员们希望通过这一框架吸引并凝聚研究社区的集体力量,从而促进时间序列预测领域的进步。

通过解决这些问题,微软亚洲研究院的研究员们将不断探索时间序列预测研究的边界,致力于研发出更加稳健、多功能且能够应对各种实际工业预测场景和挑战的时间序列模型。未来,完善的预测模型将极大激发多个行业的潜力,推动资源的高效利用、优化决策流程以及提升运营效率,从而加速产业智能化发展,并提升人们的生活品质。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/45566.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JavaScript青少年简明教程:开发工具与运行环境

JavaScript青少年简明教程:开发工具与运行环境 JavaScript是一种基于对象和事件驱动且具有安全性能的脚本语言。使用它和HTML结合可以开发出交互式的Web页面。 脚本语言是为了缩短传统的编写-编译-链接-运行过程而创建的计算机编程语言。脚本通常是解释执行而非编…

阿里巴巴矢量图标库使用

阿里巴巴矢量图标库官网 添加图标到购物车 悬浮到图标上面会有个购物车icon,点击一下就可以添加购物车了 添加图标到项目 添加完购物车后,右上角会有当前在购物车的数量,点击右上角购物车icon,在新弹窗内点击添加至项目,选择添加到哪个项目(没有项目就创建一个),点击完成,…

Milvus 核心设计(1) ---- 数据一致性的等级及使用场景

目录 背景 Milvus的数据一致性 设置数据一致性等级 等级类型 PACELC定理 level 详细解释 Strong Bounded staleness Session Eventually 总结 背景 分布式上的可扩展性是个比较重要的concept。Chroma 核心之前写过了,他的最大优势在于轻量级且好用。Milvus相对Ch…

初识Spring Web MVC

1. 什么是 Spring Web MVC? Spring Web MVC 是基于 Servlet API 构建的原始 Web 框架,从⼀开始就包含在 Spring 框架中。它的正式名称“Spring Web MVC”来⾃其源模块的名称(Spring-webmvc),但它通常被称为"SpringMVC".Servlet&am…

省市县下拉框的逻辑以及多表联查的实例

2024.7.12 一. 省市县的逻辑开发。1、准备:1.1. 要求:1.2 数据库表: 2. 逻辑:3. 方法3.1 创建实体类3.2 数据访问层3.3 实现递归方法3.4 控制器实现3.5 前端处理 二、多表联查(给我干红温了)1. 出现了问题2…

Mac VSCode 突然闪退、崩溃、打不开了

vscode 1.90.2版本下载,刚上传还在审核中 1、 思路历程 VSCode 作为前端常用开发工具,其重要性就不一一描述了。 所以 VSCode 突然打不开了,真的是让我一脸懵逼。 本来以为问题不大,于是 : 1、重启了一下VSCode 2、…

【C语言】实践:贪吃蛇小游戏(附源码)

欢迎光顾我的homepage 前言 贪吃蛇小游戏想必大家都玩过吧,现在就要C语言代码来实现一下贪吃蛇小游戏 在实现之前,我们要对C语言结构体、指针、链表(单链表)有一定的基础 先来看一下预期运行效果 一、Win32 API 这里实现贪吃蛇游戏会使用一些Win32 AP…

论文阅读【时间序列】TimeMixer (ICLR2024)

【时间序列】TimeMixer (ICLR2024) 原文链接:TIMEMIXER: DECOMPOSABLE MULTISCALE MIXING FOR TIME SERIES FORECASTING 代码仓库:https://github.com/kwuking/TimeMixer 符号定义 符号含义P用于预测的历史序列长度(seq_len)F预测…

权力之望账号怎么注册 权力之望注册游戏账号教程

不会吧不会吧,这款新的MMORPG游戏,权力之望,马上就要上线啦。支援PC 及行动装置跨平台游玩的MMORPG《权力之望》以Unity 引擎研发,利用动态捕捉、3D 扫描技术呈现细腻的游戏画面。本作主打高自由度的武器选择成长与后续的战斗类型…

分割——半自动打标签工具ISAT详细安装及使用教程

💪 专业从事且热爱图像处理,图像处理专栏更新如下👇: 📝《图像去噪》 📝《超分辨率重建》 📝《语义分割》 📝《风格迁移》 📝《目标检测》 📝《暗光增强》 &a…

C语言中的数组:掌握数据的有序集合【一维数组,二维数组,字符串数组,直方图打印,计算全排列,字符数组常用函数】

目录 C语言中的数组:掌握数据的有序集合【一维数组,二维数组,字符串数组】一维数组一维数组的创建数组的七种初始化完全初始化:部分初始化:字符数组的初始化:自动初始化为0:使用memset函数初始化…

[C++]初识C++(命名空间,命名空间使用,函数重载,缺省参数等)

💖💖💖欢迎来到我的博客,我是anmory💖💖💖 又和大家见面了 欢迎来到C探索系列 作为一个程序员你不能不掌握的知识 先来自我推荐一波 个人网站欢迎访问以及捐款 推荐阅读 如何低成本搭建个人网站…

c++之类和对象上

目录 1. 类的定义 2. 访问限定符 3. 类域 4. 实例化 5. 对象的大小 6. 为什么要内存对齐 7. this指针 1. 类的定义 • class为定义类的关键字,Stack为类的名字,{}中为类的主体,注意类定义结束时后⾯分号不能省 略。类体中内容称为类的…

(篇一)走进FreeRtos—认识FreeRtos

【温故知新篇】 【在现在的工作中一直在使用FreeRtos,但是对它的了解还是不够深入,现在由浅入深,分模块学习和记录,最后将自己基于FreeRtos开发项目实践】 首先我们将这个系统当作一座庄园,开始第一步走进庄园&#…

【备战秋招】——算法题目训练和总结day4

【备战秋招】——算法题目训练和总结day4😎 前言🙌Fibonacci数列我的题解思路分享代码分享 单词搜索我的题解思路分享代码分享 杨辉三角我的题解思路分享代码分享 总结撒花💞 😎博客昵称:博客小梦 😊最喜欢…

ubuntu重装系统后,安装cuda,cudnn

一、 先安装驱动,如果驱动安装不成功,会影响桌面,再重装系统还来得及,尝试了很多方法,还是用系统安装最靠谱: 首先进入Ubuntu搜索栏目,找到软件更新器的一个图标,点开之后是这样的。…

开发个人Ollama-Chat--5 模型管理 (二)

开发个人Ollama-Chat–5 模型管理 (二) ChatGPT 这是该项目的最终效果,使用ollama的open-webui进行人与机器的对话功能,对话的后端服务则完全对接自己开发的Go项目。 如何实现呢?则通过这篇文章,一一给大家剖析后端的原理及功能…

mmaction2的GPU环境配置记录RTX3090,cuda12.2,ubuntu22.04版本

1、配置镜像源 最重要的一个步骤,先看下镜像源地址,如果镜像源有问题,所有的包安装都会有问题 镜像源地址获取地址:选择对应的ubuntu版本号,将里面的镜像源地址复制出来,更新到服务器 ubuntu | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirro…

牛客小白月赛98

骰子魔术 jackle 会拿出一枚骰子,骰子的表面分别写上了从 1∽5001\backsim 5001∽500 的数字,朋友会随便说一个 1∽5001\backsim 5001∽500 之间的点数,jackle 都能保证百分之百的掷出这个点数。 当然 jackle 有备而来,他准备了 …

LeetCode分发糖果(贪心思路分析)

题目描述 贪心思路 思路及解法 我们可以将「相邻的孩子中&#xff0c;评分高的孩子必须获得更多的糖果」这句话拆分为两个规则&#xff0c;分别处理。 左规则&#xff1a;当 ratings[i−1]<ratings[i] 时&#xff0c;i 号学生的糖果数量将比 i−1 号孩子的糖果数量多。 …