【PaperInFive-时间序列预测】TSMixer:用于时间序列预测的全MLP架构(谷歌)

全文总结:本文研究了线性模型用于时间序列预测的能力,提出了时间序列混合器(TSMixer),一种通过堆叠多层感知器(mlp)设计的新架构。TSMixer在时间和特征维度上交替应用mlp,在概念上对应于时间混合和特征混合操作,有效地捕获时间模式和交叉变量信息。

题目:TSMixer: An All-MLP Architecture for Time Series Forecasting

作者:Si-An Chen

期刊/会议:Transactions on Machine Learning Research
时间:2023
链接:https://doi.org/10.48550/arXiv.2303.06053
源码:

https://github.com/google-research/google-research/tree/master/tsmixer
别人复现的基于TF的代码:https://github.com/marcopeix/time-series-analysis/blob/master/TSMixer.ipynb

问题背景

时间序列预测是许多现实世界用例中普遍存在的问题,作者指出时间序列数据的可预测性往往源于三个主要方面:

1.持续的时间模式(Persistent temporal patterns):包括趋势和季节性模式,例如,长期通货膨胀、工作日的影响;

2.交叉变量信息(Cross-variate information):不同变量之间的相关性,例如,血压升高与体重升高相关;

3.辅助特征(Auxiliary features):包括静态特征和未来信息,如产品类别和促销活动。

近年来,基于transformer的模型热度持续高涨,因为它们能够捕捉复杂的时间模式和交叉变量依赖关系。然而,Zeng等人(Are Transformers Effective for Time Series Forecasting?)(https://doi.org/10.1609/aaai.v37i9.26317)揭示了情况并不总是如此,在许多常用的预测基准上,基于Transformer的模型确实可能比简单的单变量时间线性模型差得多。当目标时间序列与其他协变量不相关时,多变量模型似乎受到过拟合的影响。

基于此,作者希望提出一种能够同时且高效利用多元时间序列中的时间模式和交叉变量依赖关系的模型,并深入探讨交叉变量对时间序列预测的影响情况。

图片

研究方法

1. 探究时间序列中线性模型的有效性

作者首先将线性模型与其他架构进行比较,表明线性模型具有RNN和Transformer中不存在的特征——它们具有适当的表示能力来学习单变量时间序列的时间依赖性。

下面给出作者原文中的解释:

继Zeng et al.(2023)和Nie et al.(2023)的讨论之后,我们对线性模型的分析为为什么以前的深度学习模型倾向于过拟合数据提供了更深入的见解。线性模型具有一个独特的特点,即输入序列中每个时间步的映射权重是固定的。

这种”时间步长依赖”的特性是我们之前发现的一个关键组成部分,与循环或基于注意力的架构形成对比,后者输入序列上的权重是”数据依赖”函数的输出,如LSTMs中的门或Transformer中的注意力层。时间步长依赖的模型与数据依赖的模型如图2所示。时间步长相关的线性模型虽然简单,但被证明在建模时间模式方面非常有效。

相反,即使循环或注意力架构具有较高的表征能力,但实现时间步独立对它们来说是具有挑战性的。他们通常对数据进行过拟合,而不是只考虑位置。线性模型的这种独特性质可能有助于解释Zeng等人(2023)的结果,其中没有其他方法被证明可以匹配线性模型的性能。

图片

从中可以总结出以下结论:在RNN和Transformer架构的模型中,每一个时刻的权重系数都与输入数据息息相关,即不同输入在相同时刻的权重是不一致的,这可能导致过拟合的问题。相反,线性模型在每一个时刻都赋予了固定的权重,是一种基于“时间步长”的模型,可以有效降低过拟合的风险。

作者还指出,现实世界的时间序列数据可能具有高度的波动性,使得模式具有非周期性和非平滑性。在这种情况下,仅仅依靠过去观察到的时间模式可能不是最优的。因此需要促使我们在线性模型的基础上开发一个更强大的模型,有效利用多元信息,因为其他协变量可能包含可用于建模波动的信息。

2. TSMixer模型架构

点击【PaperInFive-时间序列预测】TSMixer:用于时间序列预测的全MLP架构(谷歌)可查看全文

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/52268.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI开发者大赛 | 6道算法赛题上新

2024 AI开发者大赛正在如火如荼地进行着,本届比赛吸引了全球范围内的众多优秀开发者参与其中,用代码书写未来,用算法改变世界。 如今,算法赛新一批赛题上线,无论是初学者还是资深开发者,你都可以在2024 AI…

ClickHouse集群的安装

目录 1.clickhouse中文文档地址 2.centos安装部署 2.1采用tgz的方式安装 2.2修改配置文件 2.3修改数据目录 2.4创建角色和目录 3 集群安装 3.1配置文件修改 3.2启动zookeeper 3.3启动clickhouse-server 3.4任意节点连接clickhouse 3.5查看集群 3.6建库 3.7查看数…

【Kotlin】在Kotlin项目中使用AspectJ

前言 AOP编程在Java开发中是一个非常火热的话题,最著名的库为AspectJ Kotlin项目中,通过Gradle插件,也能够使用该库,这是我们下面讲解的重点 由于AspectJ的原理是在预编译阶段,通过插件修改代码,生成代理…

了解住宅代理和移动代理的工作原理:从基础到高级应用

在当今时代,代理技术已经成为了优化网络连接、提升数据安全和增强用户体验的重要工具。特别是住宅代理和移动代理,这两种代理类型在网络服务中扮演着越来越重要的角色。本文将从详细的为您介绍这两种代理服务的工作原理,帮助你更好地理解并应…

如何对 GitLab 中文版进行升级?

极狐GitLab 是 GitLab 在中国的发行版,专门面向中国程序员和企业提供企业级一体化 DevOps 平台,用来帮助用户实现需求管理、源代码托管、CI/CD、安全合规,而且所有的操作都是在一个平台上进行,省事省心省钱。可以一键安装极狐GitL…

ArcGIS空间自相关 (Global Moran‘s I)——探究人口空间格局的20年变迁

先了解什么是莫兰指数? 莫兰指数(Morans I)是一种用于衡量空间自相关性的统计量,即它可以帮助我们了解一个地理区域内的观测值是否彼此相关以及这种相关性的强度和方向。 白话版:一句话就是判断数据在空间上有没有自…

Prometheus 和 Grafana 通过nginx-exporter监控nginx

在生产环境下,您已经部署了 Prometheus 和 Grafana,并希望通过它们来监控另一台 Ubuntu 20.04 上的 Nginx 服务。以下是配置步骤: 1. 安装和配置 nginx-exporter (Nginx 的 Prometheus 导出器) nginx-exporter 是 Prometheus 用来从 Nginx …

【机器学习-监督学习】逻辑斯谛回归

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈Python机器学习 ⌋ ⌋ ⌋ 机器学习是一门人工智能的分支学科,通过算法和模型让计算机从数据中学习,进行模型训练和优化,做出预测、分类和决策支持。Python成为机器学习的首选语言,…

matlab实现模拟退火算法

模拟退火算法(Simulated Annealing, SA)是一种通用概率优化算法,用于在给定的大搜索空间内寻找问题的近似全局最优解。该算法灵感来源于物理学中固体物质的退火过程,其中温度逐渐降低,粒子逐渐趋于能量最低状态。 在M…

深度学习 --- VGG16各层feature map可视化(JupyterNotebook实战)

VGG16模块的可视化 VGG16简介: VGG是继AlexNet之后的后起之秀,相对于AlexNet他有如下特点: 1,更深的层数!相对于仅有8层的AlexNet而言,VGG把层数增加到了16和19层。 2,更小的卷积核!…

(六)Flink 窗口计算

窗口(Window)是处理无界流的关键所在。窗口可以将数据流装入大小有限的“桶”中,再对每个“桶”加以处理。 目录 时间概念 窗口类型 窗口划分 窗口的生命周期 Window Assigners 窗口函数 Triggers 窗口触发器 Evictor 数据剔除器 Allowed Lateness 旁路输出 时间…

程序员如何平衡日常编码工作与提升式学习?

引言 在如今这个技术飞速发展的时代,程序员不仅需要专注于完成日常的编码任务,还必须不断提升自己的技能,以应对行业的变化和个人职业发展的需求。然而,在高强度的工作环境中,找到时间进行学习是一项挑战。许多程序员陷入了这样的困境:一方面,日常的编码工作要求高效且…

苹果手机照片格式heic怎么改jpg?教你3招快速转换

苹果手机照片格式heic怎么改jpg?将苹果手机照片格式从HEIC转为JPG,在日常使用中带来了极大便利。HEIC格式虽高效节省空间,但兼容性不如JPG广泛。转为JPG后,照片能轻松在多数设备、软件和在线平台上分享、打印或编辑,无…

【论文阅读】A Closer Look at Parameter-Efficient Tuning in Diffusion Models

Abstract 大规模扩散模型功能强大,但微调定制这些模型,内存和时间效率都很低。 本文通过向大规模扩散模型中插入小的学习器(称为adapters),实现有效的参数微调。 特别地,将适配器的设计空间分解为输入位置、输出位置、函数形式的…

EmguCV学习笔记 VB.Net 第5章 图像变换

版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。 EmguCV是一个基于OpenCV的开源免费的跨平台计算机视觉库,它向C#和VB.NET开发者提供了OpenCV库的大部分功能。 教程VB.net版本请访…

探索Python的自动化魔法:AutoIt库揭秘

文章目录 探索Python的自动化魔法:AutoIt库揭秘第一部分:背景介绍第二部分:AutoIt是什么?第三部分:如何安装AutoIt库?第四部分:AutoIt的五个简单函数第五部分:场景应用第六部分&…

Pod基础使用

POD基本操作 1.Pod生命周期 在Kubernetes中,Pod的生命周期经历了几个重要的阶段。下面是Pod生命周期的详细介绍: Pending(待处理): 调度: Pod被创建后,首先进入“Pending”状态。此时,Kubernetes的调度器…

云计算产业链图谱_产业链全景图_云计算行业市场分析

在产业数字化转型的背景下,云计算作为信息技术的重要组成部分,正逐渐成为各行业数字化、智能化转型的关键支撑。受益于5G、大数据、物联网、人工智能等技术的快速发展,云计算产业规模持续扩大,市场需求不断增长。云计算作为一种新…

C语言 | Leetcode C语言题解之第367题有效的完全平方数

题目&#xff1a; 题解&#xff1a; bool isPerfectSquare(int num) {long long left0;long long rightnum;while(left<right){long long mid(leftright)/2;long long ansmid*mid;if(ans<num){leftmid1;}else if(ans>num){rightmid-1;}else{return true;}}return…

书生模型实战L1---OpenCompass 评测

书生模型实战系列文章目录 第一章 入门岛L0&#xff08;Linux&#xff09; 第二章 入门岛L0&#xff08;python&#xff09; 第三章 入门岛L0&#xff08;Git&#xff09; 第四章 基础岛L1&#xff08;书生全链路开源介绍&#xff09; 第五章 基础岛L1&#xff08;Demo&#x…