PatchTST创新点

这篇论文的创新点主要集中在PatchTST模型的设计和应用中。以下是对其创新点的详细说明:

创新点

  1. 频道独立补丁设计:PatchTST模型通过将多变量时间序列分割成不同的频道,每个频道作为单变量时间序列处理。每个频道独立地通过实例归一化操作和补丁分割过程,避免了传统方法中可能的频道间信息混杂,提高了模型的泛化能力和效率。

  2. 补丁(Patching):补丁设计的引入显著减少了模型的时间和空间复杂度。通过将输入序列分割成长度为 P P P的补丁,并以步幅 S S S进行非重叠分割,使得输入标记的数量从 L L L减少到 L / S L/S L/S。这使得注意力图的内存使用和计算复杂度减少了 S S S倍,从而在计算资源有限的情况下允许模型查看更长的历史序列。

  3. 自监督表示学习:引入了掩码自监督学习机制,通过随机选择并掩码部分补丁,模型被训练来重建这些被掩码的补丁。这样,模型不仅在监督预测任务中表现出色,还能在无标签数据上学习有用的表示,从而提高了表示的通用性和迁移能力。

公式详细解释

补丁过程公式

N = ⌊ L − P S ⌋ + 2 N = \left\lfloor \frac{L-P}{S} \right\rfloor + 2 N=SLP+2
其中, N N N是补丁的数量, L L L是输入序列长度, P P P是补丁长度, S S S是步幅。这个公式用于计算输入序列在分割成补丁后的补丁数量。

补丁的生成过程可以用以下公式描述:
x p ( i ) ∈ R P × N \mathbf{x}^{(i)}_p \in \mathbb{R}^{P \times N} xp(i)RP×N
其中, x p ( i ) \mathbf{x}^{(i)}_p xp(i)是第 i i i个单变量序列的补丁矩阵,维度为 P × N P \times N P×N

Transformer编码器

补丁通过可训练的线性投影映射到Transformer潜在空间:
x d ( i ) = W p x p ( i ) + W p o s \mathbf{x}^{(i)}_d = \mathbf{W}_p \mathbf{x}^{(i)}_p + \mathbf{W}_{pos} xd(i)=Wpxp(i)+Wpos
其中, W p ∈ R D × P \mathbf{W}_p \in \mathbb{R}^{D \times P} WpRD×P是线性投影矩阵, W p o s ∈ R D × N \mathbf{W}_{pos} \in \mathbb{R}^{D \times N} WposRD×N是可学习的加性位置编码, x d ( i ) ∈ R D × N \mathbf{x}^{(i)}_d \in \mathbb{R}^{D \times N} xd(i)RD×N是投影后的补丁表示。

多头注意力机制的计算公式为:
Q h ( i ) = ( x d ( i ) ) T W h Q , K h ( i ) = ( x d ( i ) ) T W h K , V h ( i ) = ( x d ( i ) ) T W h V \mathbf{Q}^{(i)}_h = (\mathbf{x}^{(i)}_d)^T \mathbf{W}^Q_h, \quad \mathbf{K}^{(i)}_h = (\mathbf{x}^{(i)}_d)^T \mathbf{W}^K_h, \quad \mathbf{V}^{(i)}_h = (\mathbf{x}^{(i)}_d)^T \mathbf{W}^V_h Qh(i)=(xd(i))TWhQ,Kh(i)=(xd(i))TWhK,Vh(i)=(xd(i))TWhV
其中, W h Q , W h K ∈ R D × d k \mathbf{W}^Q_h, \mathbf{W}^K_h \in \mathbb{R}^{D \times d_k} WhQ,WhKRD×dk W h V ∈ R D × D \mathbf{W}^V_h \in \mathbb{R}^{D \times D} WhVRD×D

注意力输出的计算公式为:
( O h ( i ) ) T = Attention ( Q h ( i ) , K h ( i ) , V h ( i ) ) = Softmax ( Q h ( i ) ( K h ( i ) ) T d k ) V h ( i ) (\mathbf{O}^{(i)}_h)^T = \text{Attention}(\mathbf{Q}^{(i)}_h, \mathbf{K}^{(i)}_h, \mathbf{V}^{(i)}_h) = \text{Softmax} \left( \frac{\mathbf{Q}^{(i)}_h (\mathbf{K}^{(i)}_h)^T}{\sqrt{d_k}} \right) \mathbf{V}^{(i)}_h (Oh(i))T=Attention(Qh(i),Kh(i),Vh(i))=Softmax(dk Qh(i)(Kh(i))T)Vh(i)

损失函数

L = E x 1 M ∑ i = 1 M ∥ x ^ L + 1 : L + T ( i ) − x L + 1 : L + T ( i ) ∥ 2 2 \mathcal{L} = \mathbb{E}_{\mathbf{x}} \frac{1}{M} \sum_{i=1}^{M} \left\| \hat{\mathbf{x}}^{(i)}_{L+1:L+T} - \mathbf{x}^{(i)}_{L+1:L+T} \right\|^2_2 L=ExM1i=1M x^L+1:L+T(i)xL+1:L+T(i) 22
该公式表示我们选择使用均方误差(MSE)损失来衡量预测值与真实值之间的差异。每个频道中的损失汇总并在 M M M个时间序列上取平均值,以获得总体目标损失。

结论

论文通过创新性的PatchTST模型,利用补丁分割和自监督学习显著提高了时间序列预测的性能。通过减少计算复杂度和提高表示学习能力,PatchTST展示了其在处理长时间序列预测任务中的优势。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/38561.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

明星中药企业系列洞察(九)一手好牌打的稀烂!近500年老字号锁定退市,太安堂为何“塌房”了?

近日,太安堂发布公告称,公司已收到深交所下发的《关于广东太安堂药业股份有限公司股票终止上市的决定》,深交所决定终止公司股票上市,预计其最后交易日期为7月4日。太安堂曾作为国内知名的中成药上市公司之一,是国家级…

matlab仿真 通信信号和系统分析(上)

(内容源自详解MATLAB/SIMULINK 通信系统建模与仿真 刘学勇编著第三章内容,有兴趣的读者请阅读原书) 一、求离散信号卷积和 主要还是使用卷积函数conv,值得注意的是,得到的卷积和长度结果为81&#xff0…

node.js+uniapp(vue),阿里云短信验证码

reg.vue: 思路是&#xff1a;前端调用获取验证码的接口 > 后端生成验证码返回给前端 > 前端渲染验证码 <template> <div> <input class"sl-input" v-model"phone" type"tel" maxlength"11" placeholder"手…

微信小程序毕业设计-微信食堂线上订餐系统项目开发实战(附源码+论文)

大家好&#xff01;我是程序猿老A&#xff0c;感谢您阅读本文&#xff0c;欢迎一键三连哦。 &#x1f49e;当前专栏&#xff1a;微信小程序毕业设计 精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; &#x1f380; Python毕业设计…

【在线评论】不同视角下在线评论对客户满意度和推荐度的影响—推文分析—2024-07-01

今天的推文主题是【在线评论】&#xff0c;重点关注可以关注第四篇&#xff0c;很全面地分析了在线评论的信息多维性。 第一篇从客户的在线评论入手&#xff0c;将客户消费的动机为功利、享受、社会满足&#xff1b;第二篇是关于在线评论对消费者再次选择同一家酒店的机制探索…

MySQL之主从同步、分库分表

1、主从同步的原理 MySQL主从复制的核心是二进制日志 二进制日志&#xff08;binlog&#xff09;记录了所有DDL语句和DML语句&#xff0c;但不包括数据查询&#xff08;select、show&#xff09;语句。 1.1、复制分三步 master主库在事务提交时&#xff0c;会把数据变更记录…

电子战学习笔记01:电子战概论

0、写在文前 本人在学习电子战相关理论知识时&#xff0c;一直感觉无从下手&#xff0c;之后在老师的推荐下购买了《EW101&#xff1a;电子战基础》纸质书籍学习&#xff0c;所以将自己的学习笔记在CSDN上记录一下&#xff0c;也供有需要的同学参考。 1、电子战定义 电子战&…

Spring Boot与Apache Kafka集成的深度指南

Spring Boot与Apache Kafka集成的深度指南 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01; 在现代分布式系统中&#xff0c;消息队列的作用愈发重要&#xff0…

【鸿蒙学习笔记】鸿蒙ArkTS学习笔记

应用开发导读&#xff1a;https://developer.huawei.com/consumer/cn/doc/harmonyos-guides-V5/application-dev-guide-V5 【鸿蒙培训】第&#xff11;天・环境安装 【鸿蒙培训】第&#xff12;天・装饰器・组件和页面生命周期 【鸿蒙学习笔记】数据类型 【鸿蒙学习笔记】运算…

Spring Cloud中的服务发现与注册

Spring Cloud中的服务发现与注册 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01;今天我们将探讨Spring Cloud中的服务发现与注册&#xff0c;这是微服务架构中至…

全网最详细的 gin框架请求数据绑定Bind 源码解析 -- 帮助你全面了解gin框架的请求数据绑定原理和方法

在gin框架中&#xff0c;我们可以将多种请求数据&#xff08;json, form,uri&#xff0c;header等&#xff09;直接绑定到我们定义的结构体&#xff0c;底层是通过反射方式获取我们定义在结构体上面的tag来实现请求数据到我们的结构体数据的绑定的。 在gin的底层有2大体系的数据…

Python pip install模块时C++编译环境问题

pip install模块时C编译环境问题 在接触和使用python后&#xff0c;常常会通过pip install命令安装第三方模块&#xff0c;大多数模块可以直接安装&#xff0c;但许多新同学仍会遇见某些模块需要实时编译后才能安装&#xff0c;如报错信息大概是缺乏C编译环境&#xff0c;本文则…

【Elasticsearch】Elasticsearch索引创建与管理详解

文章目录 &#x1f4d1;引言一、Elasticsearch 索引的基础概念二、创建索引2.1 使用默认设置创建索引2.2 自定义设置创建索引2.3 创建索引并设置映射 三、索引模板3.1 创建索引模板3.2 使用索引模板创建索引 四、管理索引4.1 查看索引4.2 更新索引设置4.3 删除索引 五、索引别名…

Go-知识测试-性能测试

Go-知识测试-性能测试 1. 定义2. 例子3. testing.common 测试基础数据4. testing.TB 接口5. 关键函数5.1 testing.runBenchmarks5.2 testing.B.runN5.3 testing.B.StartTimer5.4 testing.B.StopTimer5.5 testing.B.ResetTimer5.6 testing.B.Run5.7 testing.B.run15.8 testing.B…

监听蓝牙对话的BlueSpy技术复现

本文是之前文章的BlueSpy技术的复现过程&#xff1a;https://mp.weixin.qq.com/s/iCeImLLPAwwKH1avLmqEpA 2个月前&#xff0c;网络安全和情报公司Tarlogic在西班牙安全大会RootedCon 2024上提出了一项利用蓝牙漏洞的BlueSpy技术&#xff0c;并在之后发布了一个名为BlueSpy的概…

深度学习之生成对抗网络StyleGAN3

StyleGAN3 是由 NVIDIA 团队提出的第三代生成对抗网络(GAN),在前代 StyleGAN 和 StyleGAN2 的基础上进行了改进,以实现更高质量的图像生成。StyleGAN3 的主要改进在于解决了 StyleGAN2 中存在的伪影(artifacts)问题,并且提升了生成图像的一致性和稳定性。 StyleGAN3 的…

git 提交代码忽略eslint代码检测

在暂存代码的时候会出现以上情况因为在提交代码的时候会默认运行代码进行检测&#xff0c;如果不符合代码规范就会进行报错 解决&#xff1a; 使用 git commit --no-verify -m xxx 忽略eslint的检测

Laravel 谨慎使用Storage::append()

在 driver 为 local 时&#xff0c;Storage::append()在高并发下&#xff0c;会存在丢失数据问题&#xff0c;文件被覆写&#xff0c;而非尾部添加&#xff0c;如果明确是本地文件操作&#xff0c;像日志写入&#xff0c;建议使用 Illuminate\Filesystem\Filesystem或者php原生…

技术成神之路:设计模式(一)单例模式

在软件设计中&#xff0c;有时我们希望某个类的实例始终是唯一的&#xff0c;即无论在何处访问这个类&#xff0c;都能够得到同一个实例。单例模式&#xff08;Singleton Pattern&#xff09;就是为了解决这个问题而产生的。单例模式确保一个类只有一个实例&#xff0c;并提供一…

整合web-socket的常见bug

整合文章连接 此文是记录我上网查找整合方案时候踩的坑,特别是注册失败的问题,比如还有什么去掉Compoent就可以,但是这样这个端点就失效了 特别是报错: at org.springframework.web.socket.server.standard.ServerEndpointExporter.registerEndpoint(ServerEndpointExporter.…