Dish-TS: 缓解分布转移的一般范例 时间序列预测

摘要

时间序列预测(TSF)中的分布移位(即序列分布随时间的变化)在很大程度上阻碍了TSF模型的性能。现有的关于时间序列中分布变化的研究大多局限于分布的量化,更重要的是,忽视了回望窗和地平线窗之间的潜在变化。为了应对上述挑战,我们系统地将TSF的分布变化归纳为两类。将回望窗作为输入空间,视界窗作为输出空间,存在(1)空间内移动,即输入空间内的分布随时间不断移动;(2)空间间移动,即分布在输入空间和输出空间之间移动。然后,我们介绍了Dish-TS,一种缓解TSF分布变化的通用神经范式。具体来说,为了更好地估计分布,我们提出了系数网(CONET),它可以是任何神经结构,将输入序列映射到可学习的分布系数。为了缓解空间内和空间间的移位,我们将Dish-TS组织成一个Dual-CONET框架,分别学习输入和输出空间的分布,自然地捕捉了两个空间的分布差异。此外,我们还为棘手的CONET学习引入了一种更有效的训练策略。最后,我们在几个数据集上进行了广泛的实验,并结合了不同的最先进的预测模型。实验结果表明,DishTS可以持续提高20%以上的效率。

论文:
Dish-TS: A General Paradigm for Alleviating Distribution Shift in
Time Series Forecasting
作者:
Wei Fan , Pengyang Wang*, Dongkun Wang, Yanjie Fu*
代码:https://github.com/weifantt/Dish-TS

在分析了大量的系列数据后,我们系统地将TSF的分布变化分为两类。考虑回看窗口(简称“回看”)作为模型的输入空间,水平窗口(简称“地平线”)作为模型的输出空间,存在(i)空间内移位:时间序列分布随时间变化,使得输入空间(回看)内的数据发生移位;(ii)空间间转移:分布在输入空间(回视)和输出空间(视界)之间转移。现有的工作已经试图缓解TSF中的分配移位问题(Ogasawara et al. 2010;Passalis et al. 2019;Du et al. 2021;Kim et al. 2022)。然而,它们中的大多数都有两个局限性:

首先,TSF的空间内分布量化是不可靠的。理想情况下,时间序列是由真实分布连续生成的,而观测数据实际上是在一定记录频率下由传感器离散采样的。现有作品总是直接规范化或重新调整系列(Ogasawara et al. 2010;Passalis et al. 2019;Kim et al. 2022),通过使用经验地从观测数据中获得的固定统计量(例如平均值和std)来量化真实分布,然后使用这些统计量对序列分布进行正态化。然而,经验统计在表达数据背后的真实分布方面是不可靠的和有限的。例如,图1(b)显示了从不同频率(即每十分钟、每小时、每天)的同一序列中采样的三个分布(用平均值和标准差表示)。尽管来自相同的序列,不同的采样频率提供不同的统计数据,这就引发了一个问题:哪一个最能代表真实的分布?由于时间序列的记录频率是由传感器决定的,因此很难确定数据背后的真实分布。因此,如何恰当地量化空间内的分布,以及空间内的分布位移,仍然是一个有待解决的问题。

其次,忽略了TSF的空间间位移。在时间序列预测中,将输入序列(回看)和输出序列(视界)视为两个空间,现有的工作总是假设输入空间和输出空间默认遵循相同的分布(Ogasawara et al. 2010;Passalis et al. 2019;Du et al. 2021)。尽管最近的一项研究RevIN (Kim et al. 2022)试图通过规范化输入和非规范化输出来对齐实例,但它仍然假设回顾和视界具有相同的统计属性;所以分布是一样的。尽管如此,在输入空间和输出空间之间的分布总是有变化的。如图1©所示,回望窗和水平窗之间的分布(用均值和标准差表示)显示出相当大的差异。对空间间位移的忽视忽略了输入空间和输出空间之间的差距,从而阻碍了预测性能。

为了克服上述限制,我们提出了一种有效的通用神经范式,Dish-TS,用于对抗时间序列中的分布移位。Dish-TS与模型无关,可以与任何深度TSF模型耦合。受(Kim et al. 2022)的启发,Dish-TS包括一个两阶段的过程,在预测之前对模型输入进行规范化,在预测之后对模型输出进行反规范化。为了解决序列分布量化不可靠的问题,我们首先提出了一种系数网(CONET)来度量序列分布。给定序列数据的任意窗口,CONET将其映射为两个可学习的系数:水平系数和缩放系数,以说明序列的总体规模和功能。一般来说,CONET可以被设计成任何神经体系结构来进行任何线性/非线性映射,提供了足够的各种复杂性的建模能力。为了缓解上述空间内移位和空间间移位,我们将Dish-TS组织为一个Dual-CONET框架。具体来说,Dual-CONET由两个独立的conet组成:(1)BACKCONET,它产生系数来估计输入空间(回看)的分布,以及(2)HORICONET,它产生系数来推断输出空间(视界)的分布。Dual-CONET设置分别捕获输入空间和输出空间的不同分布,这自然减轻了空间间的移位。

此外,考虑到HORICONET需要推断(或预测)输出空间的分布,由于空间间的移位,输出空间的分布更加难以处理,进一步引入了一种有效的先验知识诱导训练策略,用于CONET学习。因此,利用一些额外的输出空间分布特征为HORICONET提供更多的先验知识监督。综上所述,我们的贡献如下:

  • 我们将时间序列预测中的分布移位系统地组织为空间内移位和空间间移位。
  • 我们提出了Dish-TS,这是一种缓解TSF分布移位的通用神经范式,建立在双重conet基础上,共同考虑空间内和空间间的移位。
  • 为了实现Dish-TS,我们提供了一个最简单直观的CONET设计实例,并采用先验知识诱导的培训方式来展示该范例的有效性。
  • 在各种数据集上进行的广泛实验表明,我们提出的Dish-TS持续提高当前SOTA模型,单变量预测平均提高28.6%,多变量预测平均提高21.9%。

相关工作

时间序列预测中的分布移位。尽管有许多出色的模型,考虑到现实世界序列的分布随着时间的推移而变化,时间序列预测仍然受到分布变化的影响(Akay和Atak 2007)。为了解决这个问题,提出了一些归一化技术:Adaptive Norm (Ogasawara et al. 2010)通过计算的全局统计量对序列进行z-score归一化。然后,DAIN (Passalis et al. 2019)应用非线性神经网络对序列进行自适应归一化。(Du et al. 2021)提出了自适应rnn来处理时间序列中的分布移位。最近,RevIN (Kim et . 2022)提出了一种实例归一化方法来减少序列移位。尽管DAIN使用简单的神经网络进行归一化,但大多数作品(Ogasawara et al. 2010;Du et al. 2021;Kim et al. 2022)仍然使用静态统计或距离函数来描述分布和归一化序列,其表达能力有限。其他一些作品研究了某些领域(如交易市场)的时间序列分布变化(Cao et al. 2022)。此外,它们几乎没有考虑模型输入空间和输出空间之间的空间间位移。

问题描述

输入:在这里插入图片描述

输出:
在这里插入图片描述
式中,L为回望窗长度,H为视界窗长度。

空间内移动被定义为
在这里插入图片描述
其中δ为小阈值;D是距离函数(例如,KL散度)
相反,空间间位移为
在这里插入图片描述

Dish-TS

在本节中,我们详细介绍我们的一般神经范式,Dish-TS。我们将在4.1节中概述这种范例。然后,我们在4.2节中说明Dish-TS的体系结构。此外,我们在第4.3节中提供了一个简单直观的Dish-TS实例,并在第4.4节中引入了先验知识诱导的训练策略,以演示针对预测转变的可行设计。

Dish-TS是一个简单而有效的,灵活的范例,反对时间序列中的分布变化。受到Kim等人的启发。 Dish-TS包括两个阶段的过程,预测前的规范化和预测后的非规范化。范式建立在系数网(CONET)的基础上,它将输入序列映射为系数,以便进行分布测量。如图2所示,Dish-TS被组织为双conet框架,包括用于说明输入空间(回看)的BACKCONET和用于说明输出空间(视界)的HORICONET。回看的数据经过BACKCONET的系数变换后,再用于任何预测模型FΘ;输出(即预测结果)通过来自HORICONET的系数进行转换以获得最终预测。此外,HORICONET可以以先验知识诱导的方式进行训练,这是一种更有效的方法,特别是在长序列预测中。
在这里插入图片描述

实验

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/25608.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VM-Import 导入 Debian 12 系统

介绍 之前介绍过使用 VM-Import 导入 Windows 系统到 AWS 环境启动 EC2 实例, 本文将介绍如何导入 Debian 12 系统. 本地虚拟化使用 VMWare Workstation 创建虚拟机安装和准备 Debian 12 系统, 导出 OVA 文件后上传到 S3 存储桶中再使用 AWSCLI 执行 VM-Import 命令实现导入过…

【Vue】获取模块内的state数据

目标: 掌握模块中 state 的访问语法 尽管已经分模块了,但其实子模块的状态,还是会挂到根级别的 state 中,属性名就是模块名 使用模块中的数据 直接通过模块名访问 $store.state.模块名.xxx 通过 mapState 映射: 默认…

mac免费的ntfs软件哪个好 MAC读取NTFS硬盘格式

对于苹果用户来说,Mac电脑和移动硬盘已经成为日常工作中不可缺少的一部分,但有时我发现Mac打开移动硬盘只能读取无法写入,这是由于所连接的移动硬盘为NTFS格式。我们可以通过对硬盘格式化为Mac正常读写格式,或使用数据读写软件对N…

DNS协议 | NAT技术 | 代理服务器

目录 一、DNS协议 1、DNS背景 2、DNS协议 域名 域名解析 二、NAT技术 1、NAT技术 2、NAPT技术 3、NAT技术的缺陷 三、代理服务器 1、正向代理服务器 2、反向代理服务器 一、DNS协议 域名系统(Domain Name System,缩写:DNS&#…

Zabbix配置中文显示及乱码问题

页面配置为中文显示 在zabbix 5.0版本开始用户菜单更改为左侧栏显示,找到并点击 User Settings,Language 修改语言为 Chinese (zh_CN) 即可。 PS:一般在部署后初始配置时,未找到 Chinese (zh_CN) 这一项,修改如下&…

深度学习中embedding层的理解

Embedding层作用 在深度学习领域中,Embedding层扮演着至关重要的角色,尤其在处理文本数据或类别数据。Embedding层的功能有两个: 1. 将高维稀疏的输入数据(如单词、类别标签等)转换为低维稠密的向量表示,…

数 据 类 型

概述 Java 是强类型语言。 每一种数据都定义了明确的数据类型,在内存中分配了不同大小的内存空间(字节)。 Java 中一共有 8 种基本类型(primitive type),包括 4 种整型、2 种浮点型、1 种字符类型&#…

Vulnhub靶机之reven 1

一、信息收集 nmap扫描网段,靶机地址为192.168.145.129。 nmap -sP 192.168.145.* 扫一下端口,开放了22、80、111、50967。 nmap -sT -T4 -p1-65535 192.168.145.129 再看一下目录情况,发现一个疑似后台登录的地址。 dirsearch -u http://…

【C++修行之道】类和对象(六)再谈构造函数(初始化列表)| explicit关键字 | static成员 | 友元|匿名对象|拷贝时一些编译器优化

目录 一、再谈构造函数 1.1 构造函数体赋值 1.2 初始化列表 1. 所有的成员,既可以在初始化列表初始化,也可以在函数体内初始化 2. 每个成员变量在初始化列表中只能出现一次(初始化只能初始化一次) 3. 类中包含以下成员,必须放在初始化列表位置进行初始化&…

N32G45XVL-STB之移植LVGL(lvgl-8.2.0)

目录 概述 1 软硬件介绍 1.1 软件版本信息 1.2 ST7796-LCD 1.3 MCU IO与LCD PIN对应关系 2 认识LVGL 2.1 LVGL官网 2.2 LVGL库文件下载 3 移植LVGL 3.1 准备移植文件 3.2 添加lvgl库文件到项目 3.2.1 src下的文件 3.2.2 examples下的文件 3.2.3 配置文件路径 3.2…

VS2019专业版 C#和MFC安装

1. VS2019专业版下载地址 https://learn.microsoft.com/en-us/visualstudio/releases/2019/history 2.安装 C# 部分 MFC部分

【Linux】进程6——环境变量

1.什么是环境变量 环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数 比如:我们在编写C/C代码的时候,在链接的时候,从来不知道我们的所链接的动态静态库在哪里,但是照样可以链接成功&…

通过 Python+Nacos实现微服务,细解微服务架构

shigen坚持更新文章的博客写手,擅长Java、python、vue、shell等编程语言和各种应用程序、脚本的开发。记录成长,分享认知,留住感动。 个人IP:shigen 背景 一直以来的想法比较多,然后就用Python编写各种代码脚本。很多…

这个国际档案日,大比武放榜、直播预约、课件下载,一样都不能少!

关注我们 - 数字罗塞塔计划 - 2024年6月9日第十七个国际档案日来临,数字罗塞塔计划放大招:第二届大比武活动榜单揭晓、ARCHE-2024上海智慧档案高峰论坛直播预约、2024上半年度课件大礼包下载。如此大礼,岂能错过? PART.01 榜单…

【LeetCode 第 401 场周赛】K秒后第 N 个元素的值

文章目录 1. K秒后第 N 个元素的值🆗 1. K秒后第 N 个元素的值🆗 题目链接🔗 🐧解题思路: 前缀和 小规律🍎 🍎 从上图观察可知,规律一目了然,arr[i] arr[i] 对上一…

2024-6-9

今日安排: 学校的课程作业windows SEH 机制简单入门windows 用户态 pwn / 内核态入门 计网实验报告 && 网安实验报告继续审计 nf_tables 源码,主要看 active 相关逻辑。复现 CVE-2022-32250 这个漏洞【 && iptables 相关学习】♥♥♥♥…

基于vue的音乐播放器的设计与实现(论文+源码)_kaic

摘 要 当下,如果还依然使用纸质文档来记录并且管理相关信息,可能会出现很多问题,比如原始文件的丢失,因为采用纸质文档,很容易受潮或者怕火,不容易备份,需要花费大量的人员和资金来管理用纸质文…

【Qt秘籍】[010]-Qt常用控件

一、控件概述 在GUI(图形用户界面)开发领域,Qt无疑是众多开发者心中的首选框架之一。它不仅跨平台、功能强大,而且拥有丰富且灵活的控件库,使得开发者能够快速构建美观、高效的用户界面。对于初学者而言&#xff0…

GitLab代码导出 gitlab4j-api 实现

目录 GitLab简介 GitLab 的主要特点包括: GitLab代码导出 gitlab4j-api 添加 gitlab4j-api 依赖 使用 gitlab4j-api 获取特定命名空间下的所有项目 说明 注意事项 GitLab简介 GitLab 是一个开源的代码仓库和协作平台,主要用于版本控制和源代码管理…

深度剖析整型和浮点型数据在内存中的存储(C语言)

目录 整型在内存中的存储 为什么整型在内存中存储的是补码? 大小端字节序 为什么有大端小端? 浮点型家族 浮点数在内存中的存储 long long 整型在内存中的存储 整型在内存中有三种二进制表示形式:原码,反码,补码…