论文阅读【时空+大模型】ST-LLM（MDM2024）

论文阅读【时空+大模型】ST-LLM（MDM2024）

pingmian/2025/4/26 19:47:23/文章来源:https://blog.csdn.net/micaudience/article/details/140356174

论文阅读【时空+大模型】ST-LLM（MDM2024）

论文链接：Spatial-Temporal Large Language Model for Traffic
Prediction
代码仓库：https://github.com/ChenxiLiu-HNU/ST-LLM
发表于MDM2024（Mobile Data Management）

本文主要面向交通流量数据。
在这里插入图片描述

符号定义

符号	含义
N	交通站点数
C	特征数量
P	历史序列长度
S	预测序列长度

Spatial-Temporal Embedding and Fusion

注： $X_P \isin R^{P*N*C}$ ，但在本文实验中C=1(原文“C = 1 represents the traffic pick-up or drop-off flow”)，因而有 $X_P \isin R^{P*N}$

一般而言，spatial-temporal embedding分为：

Token Embedding: $E_P = PointwiseConv(X_P) \isin R^{N * D}$
Temporal Embedding: $E_T = E_T^d+E_T^w = W_{day}(X_{day}) + W_{week}(X_{week})\isin R^{N *D}$
Spatial Embedding: $E_S = \sigma (W_S * X_P + b_S) \isin R^{N * D}$

然后将三种embedding合并：

$H_F = FusionConv(E_P||E_S||E_T) \isin R^{N*3D}$
其中’||'是拼接符号。

Partially Frozen Attention (PFA) LLM

这部分使用GPT2捕获时空依赖。Transformer Block中训练时空开销最大的是注意力（Attention）模块。本文使用了F+U个Transformer层：

在前F层中，Attention参数冷冻，只训练Layer Norm
在后U层中，Attention参数也用于训练
经过F+U个Transformer层后，得到的 $H^{F+U}$ 后，使用一个Regression Conv获得最终结果：
$Y_S = RegressionConv(H^{F+U}) \isin R^{S*N}.$

实验

交通预测

在这里插入图片描述

从这个实验结果来看，看起来很多后来的方法都比不上DCRNN？？？

效率

在这里插入图片描述

小样本/零样本（大模型必备）

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/pingmian/45107.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

ArrayList----源码分析

ArrayList----源码分析

源码中的简介： List接口的可调整数组实现。实现所有可选列表操作，并允许所有元素，包括null。除了实现List接口之外，这个类还提供了一些方法来操作内部用于存储列表的数组的大小。(这个类大致相当于Vector，只是它是不同…

阅读更多...

TC软件许可优化解决方案

TC软件许可优化解决方案

TC功能说明 Teamcenter 软件是西门子面向全球范围开发的数字化全生命周期管理（PLM）系统，将人员、产品、流程、知识有机联系在一起，以帮助企业实现数字化协同、数字化赋能、数字化转型，从而推动企业产品创新与效率提升…

阅读更多...

Delphi 里防止程序多次运行

Delphi 里防止程序多次运行

Delphi 里防止程序多次运行在dpr里加入以下红色部分代码 program Main; uses Vcl.Forms, Windows, SysUtils, uMain in uMain.pas {MainForm}; {$R *.res} Var hMutex:HWND; Ret:Integer; begin Application.Initialize; Application.MainFormOnTaskbar : T…

阅读更多...

Java链表LinkedList经典题目

Java链表LinkedList经典题目

一.LinkedList的方法首先先看一下链表的方法： 方法解释boolean add(E e)尾插void add(int index, E element)将 e 插入到 index 位置boolean addAll(Collection c)尾插 c 中的元素E remove(int index)删除 index 位置元素boolean remove(Object o)删除遇到的第一…

阅读更多...

【EIScopus稳检索-高录用】第五届大数据与社会科学国际学术会议（ICBDSS 2024）

【EIScopus稳检索-高录用】第五届大数据与社会科学国际学术会议（ICBDSS 2024）

大会官网：www.icbdss.org 大会时间：2024年8月16-18日大会地点：中国-上海接受/拒稿通知：投稿后1-2周内收录检索：EI,Scopus *所有参会者现场均可获取参会证明，会议通知（邀请函）&…

阅读更多...

2022 RoboCom省赛题目解析

2022 RoboCom省赛题目解析

题目解析：这就是一题很简单的模拟，直接上代码； #include<iostream> using namespace std; const int N 10010; int arr[N]; int main() {int n , m;cin >> n >> m;int sum 0;int res 0;for(int i 0; i < n;i ) cin…

阅读更多...

系统服务综合作业01

系统服务综合作业01

题目： 现有主机 node01 和 node02，完成如下需求： 1、在 node01 主机上提供 DNS 和 WEB 服务 2、dns 服务提供本实验所有主机名解析 3、web服务提供 www.rhce.com 虚拟主机 4、该虚拟主机的documentroot目录在 /nfs/rhce 目录 5、该目录由 no…

阅读更多...

力扣第228题“汇总区间”

力扣第228题“汇总区间”

在本篇文章中，我们将详细解读力扣第228题“汇总区间”。通过学习本篇文章，读者将掌握如何遍历和汇总区间，并了解相关的复杂度分析和模拟面试问答。每种方法都将配以详细的解释，以便于理解。问题描述力扣第228题“汇总区间”描…

阅读更多...

程序使用多进程，打包.exe后，程序陷入死循环

程序使用多进程，打包.exe后，程序陷入死循环

最近写了一个深度学习程序，用cxfreezee打包exe后，在本地运行突然出现死循环，明明在pycharm运行一切正常。排查了问题，怀疑是多进程的原因，解决办法： 在你的主程序前添加一行代码： if __name_…

阅读更多...

Pandas数学函数大揭秘：让数据处理变得如此简单高效，轻松玩转数据分析新纪元！

Pandas数学函数大揭秘：让数据处理变得如此简单高效，轻松玩转数据分析新纪元！

1.导包 # 导包 import numpy as np import pandas as pd2.聚合函数 df pd.DataFrame(datanp.random.randint(0,100,size(5,3))) df01203550281552376231419335895434679917 # 列非空元素的数量 df.count()0 5 1 5 2 5 dtype: int64# 行非空元素的数量 df.count(ax…

阅读更多...

搜索引擎算法工程师，在query理解方面，都有哪些方面的工作

搜索引擎算法工程师，在query理解方面，都有哪些方面的工作

一、什么是query理解？ 通俗来讲，就是query整形。又可以理解为是一个转接头，把用户送来过来的奇奇怪怪的query（或者说是在搜索引擎看来是奇奇怪怪的query）转换为搜索引擎最想看到的query的。在LLM当前能力的帮助下&a…

阅读更多...

多输入多输出 | Matlab实现Transformer多输入多输出预测

多输入多输出 | Matlab实现Transformer多输入多输出预测

多输入多输出 | Matlab实现Transformer多输入多输出预测目录多输入多输出 | Matlab实现Transformer多输入多输出预测预测效果基本介绍程序设计参考资料预测效果基本介绍多输入多输出 | Matlab实现Transformer多输入多输出预测（完整源码和数据） 1.da…

阅读更多...

二分查找算法——部分OJ题详解

二分查找算法——部分OJ题详解

目录关于二分查找算法部分OJ题详解 704.二分查找一，分析题目二，细节处理三，题目代码四，*总结朴素模板 *34.在排序数组中查找元素的第一个和最后一个位置一，查找左端点二，处理左端点细…

阅读更多...

什么是Stream流

什么是Stream流

文章目录一、创建流1.1 流的类型1.2 创建 Stream 的常见操作二、中间操作2.1 流的映射2.2 流的过滤2.3 其他中间操作三、终端操作3.1 reduce() 的使用方法3.2 *short-circuiting* 方法3.3 其他的终端操作参考资料一、创建流 1.1 流的类型在 Java 8 中, 集合接口有两个…

阅读更多...

Socks5代理为何比HTTP代理快？

Socks5代理为何比HTTP代理快？

在网络世界中，代理服务器扮演着重要的角色，它们能够帮助我们访问被限制的网站、提高网络安全性以及优化网络性能。其中，Socks5代理和HTTP代理是两种常见的代理类型。然而，很多用户发现，相较于HTTP代理，Sock…

阅读更多...

awk和xargs指令

awk和xargs指令

ps -ef|grep "pytest"|awk {print $2}|xargs kill-9解释： ps -ef|grep “pytest”：表示找到pytest进程awk ‘{print $2}’：表示将第二个域打印出来，这里显示的就是进程号xargs kill-9：表示将前面的输出结果…

阅读更多...

【两大3D转换SDK对比】HOOPS Exchange VS. CAD Exchanger

【两大3D转换SDK对比】HOOPS Exchange VS. CAD Exchanger

在现代工业和工程设计领域，CAD数据转换工具是确保不同软件系统间数据互通的关键环节。HOOPS Exchange和CAD Exchanger是两款备受关注的工具，它们在功能、支持格式、性能和应用场景等方面有着显著差异。本文将从背景、支持格式、功能和性能、应用场景等…

阅读更多...

MySQL 条件函数/加密函数/转换函数

MySQL 条件函数/加密函数/转换函数

条件函数 IF(): 如果条件为真，返回一个值，否则返回另一个值。 -- 示例：根据员工的薪水返回薪水等级 SELECT name, salary, IF(salary < 3000, Low, IF(salary BETWEEN 3000 AND 7000, Medium, High)) AS salary_level FROM employ…

阅读更多...

嵌入式ARM控制器在AGV里的应用

嵌入式ARM控制器在AGV里的应用

随着ARM技术以及芯片加工工艺的迅猛发展， ARM工业计算机得到了越来越广泛的应用，尤其在工业智慧城市、智能设备以及工业自动化控制等领域。本文将为大家详细介绍ARM控制器在AGV控制系统中的应用，来供大家学习和参考，欢迎大家一起来…

阅读更多...

Linux磁盘-创建分区

Linux磁盘-创建分区

作者介绍：简历上没有一个精通的运维工程师。希望大家多多关注作者，下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 Linux磁盘涉及到的命令不是很多，但是在实际运维中的作用却很大，因为Linux系统及业务都会承载到硬盘…

阅读更多...

最新文章