AI论文速读 | 2024[KDD]自适应时空图神经网络中图中奖彩票的预训练识别

题目:Pre-Training Identification of Graph Winning Tickets in Adaptive Spatial-Temporal Graph Neural Networks

作者:Wenying Duan, Tianxiang Fang, Hong Rao, Xiaoxi He

机构:南昌大学,澳门大学

arXiv网址:https://arxiv.org/abs/2406.08287

Cool Paper:https://papers.cool/arxiv/2406.08287
Code: https://anonymous.4open.science/r/paper-1430

关键词::自适应时空图神经网络,彩票假设,图中奖票,计算效率。

TL; DR:本文提出了一种新方法,通过预训练识别图神经网络中的高效子网络(图中奖票),显著提高了自适应时空图神经网络的计算效率,同时保持了模型性能。

12 Pages 1 Preliminaries 1.5 Methodology 3.75 Experiments 1 Appendix

该研究团队在KDD23也有一篇对ASTGNNs(自适应时空图神经网络)的研究:

2023 [KDD] Localised Adaptive Spatial-Temporal Graph Neural Network

TL;DR: 对于自适应时空图神经网络(ASTGNN)在测试(推理)阶段图结构的空间信息是冗余的,训练是必要的。


🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

摘要

在本文中,提出了一种新方法,通过引入源自彩票假设 (Lottery Ticket Hypothesis,LTH) 的图中奖彩票 (Graph Winning Ticket,GWT) 概念,显著提高自适应时空图神经网络 (ASTGNN) 的计算效率。通过在训练之前采用预先确定的星型拓扑作为 GWT,本文在边缘减少和高效信息传播之间取得平衡,在保持高模型性能的同时降低了计算需求。生成自适应时空图的时间和空间计算复杂度都从 O ( N 2 ) O(N^2) O(N2) 显著降低到 O ( N ) O(N) O(N)。本文的方法简化了 ASTGNN 部署,消除了对详尽训练、剪枝和再训练周期的需求,并在各种数据集上通过实证证明,有可能以低得多的计算成本实现与完整模型相当的性能。具体来说,本文的方法能够使用配备 48 GB 显存的单张 A6000 在最大规模时空数据集上训练 ASTGNN,克服了原始训练中遇到的内存不足问题,甚至达到了最先进的性能。此外,本文从谱图理论的角度深入研究了 GWT 的有效性,提供了大量的理论支持。这一进步不仅证明了 ASTGNN 中存在高效子网络,而且拓宽了 LTH 在资源受限环境中的适用性,标志着图神经网络领域的重大进步。

Q: 这篇论文试图解决什么问题?

A: 这篇论文提出了一种新的方法,旨在显著提高自适应时空图神经网络(Adaptive Spatial-Temporal Graph Neural Networks,简称ASTGNNs)的计算效率。具体来说,论文通过引入基于彩票假设(Lottery Ticket Hypothesis,简称LTH)的图中奖票(Graph Winning Ticket,简称GWT)的概念,以期在减少计算需求的同时保持模型性能。

ASTGNNs在处理大规模时空数据时面临显著的计算开销挑战,这主要是因为它们需要学习完整的图上的自适应邻接矩阵,并且聚合阶段计算密集。论文的主要贡献包括:

  1. 提出了一种在训练前确定GWT的方法,通过采用预定的星型拓扑作为GWT,平衡了边的减少和有效信息传播之间的关系,从而在降低计算需求的同时保持了高性能。
  2. 通过实验验证了这种方法在多个数据集上与完整模型相比具有可比性,甚至在某些情况下性能更优,同时显著降低了训练和推理的计算成本。
  3. 从谱图理论的角度深入探讨了GWT的有效性,为LTH在资源受限环境中的适用性提供了理论支持。

这种方法不仅证明了ASTGNNs内存在高效的子网络,而且扩展了LTH在资源受限设置中的适用性,是图神经网络领域的重要进展。

Q: 有哪些相关研究?

A: 论文中提到了多个与时空图神经网络(STGNNs)和彩票假设(LTH)相关的研究领域和具体工作。以下是一些主要的相关研究:

  1. 时空图神经网络(STGNNs): 这类网络专注于分析时空数据,特别是动态信号在不同空间域之间的相互作用。STGNNs能够建模节点之间的空间依赖性,并且通过学习邻接矩阵来有效捕捉数据的潜在模式。
  2. 预定义和自学习方法: STGNNs可以根据构建邻接矩阵的方法分为预定义方法和自学习方法。预定义方法使用领域知识来构建图,例如ASTGNN和STGCN利用道路网络结构。自学习方法则通过时间变化的输入动态构建图,如PDFormer和DG。
  3. 彩票假设(LTH): LTH提出了在大型神经网络中存在较小的子网络(称为“中奖彩票”),这些子网络可以在隔离训练时达到与原始网络相似的性能。这个概念已经被扩展到ASTGNNs的领域,即在可学习的时空图中识别这样的子网络,即GWTs。
  4. 图彩票假设(Graph Lottery Ticket Hypothesis): 这是LTH在图神经网络(GNNs)中的扩展,研究者通过迭代应用UGS来识别图彩票。
  5. ASTGNN模型: 如Graph WaveNet和AGCRN,这些模型通过随机初始化的可学习节点嵌入来促进自适应图的生成。
  6. 谱图理论: 论文还深入探讨了谱图理论,为GWT的有效性提供了理论支持。
  7. 其他STGNNs: 论文中还提到了其他几种STGNNs,包括DGCRN、MegaCRN、STGODE、D2STGNN和DSTAGNN,这些模型代表了该领域的最新趋势。
  8. 图结构的稀疏化: 论文中提到了AGS方法,这是一种通过稀疏化空间图来提高ASTGNNs推理效率的先前工作。

这些相关研究为理解论文提出的GWT方法提供了背景,并展示了该方法在现有研究基础上的创新和改进。

Q: 论文如何解决这个问题?

完整的图和具有预先指定的节点号的星型生成树

2跳消息传递路径,红色节点为中心节点,灰色节点是叶节点

A: 论文通过以下几个关键步骤解决了提高ASTGNNs计算效率的问题:

  1. 引入图中奖票(GWT)概念:基于彩票假设(LTH),论文提出了图中奖票的概念,这是一种存在于ASTGNNs可学习空间图中的高效子网络,可以在减少计算成本的同时保持模型性能。
  2. 预确定星型拓扑:论文提出使用星型拓扑作为GWT,这种拓扑结构在减少边数的同时,仍然保持了有效的信息传播能力。星型拓扑的直径为2,可以在两层AGCN中实现全局空间依赖性的建模。
  3. 降低计算复杂度:通过使用星型拓扑,论文将生成自适应时空图的时间和内存计算复杂度从O(𝑁^2)显著降低到O(𝑁)。
  4. 简化训练过程:论文的方法避免了传统训练过程中的迭代训练、剪枝和重训练的需要,从而简化了ASTGNNs的部署。
  5. 理论和实证分析:论文从谱图理论的角度提供了对GWT有效性的深入分析,并在多个数据集上通过实验验证了星型拓扑作为GWT的性能。
  6. 提出GWT-AGCN层:为了进一步提高效率和硬件兼容性,论文提出了一种新的GWT-AGCN层,该层使用矩阵乘法和标准激活函数,与传统AGCN层相比,具有更低的计算复杂度和更好的硬件兼容性。
  7. 中心节点选择和初始化:论文讨论了中心节点选择的重要性,并提出了一种平均初始化方法,以确保中心节点嵌入向量位于节点嵌入空间的物理中心,从而提高模型的预测精度。

通过这些方法,论文不仅提高了ASTGNNs的计算效率,还保持了模型性能,甚至在某些情况下达到了最先进的性能水平。

Q: 论文做了哪些实验?

数据集

整体性能比较

*与★的说明

效率评估

A: 论文中进行了一系列实验来验证所提出方法的有效性,实验主要包括以下几个方面:

  1. 实验设置
    • 使用了两种典型的ASTGNN架构:AGCRN和Graph WaveNet (GWNET)。
    • 在五个大型时空数据集上进行实验,包括PEMS07、SD、GBA、GLA和CA。
  2. 性能评估
    • 使用了三个标准的预测准确度指标:平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)。
  3. 效率评估
    • 评估了模型训练和推理的墙钟时间。
    • 报告了训练过程中的批量大小,以反映模型处理大规模数据集的能力。
  4. 主要结果
    • 展示了AGCRN和GWNET在不同数据集上的性能和效率比较。
    • 证明了在所有数据集上,使用GWT的ASTGNNs(AGCRN★和GWNET★)与原始模型相比具有可比或更优的性能。
  5. 收敛性分析
    • 展示了原始AGCRN和AGCRN★在PEMS07和SD数据集上的损失和测试MAE曲线,证明了预确定的GWT确保了与完整图模型同样一致、快速和稳定的收敛性。
  6. 与最新技术比较
    • 将AGCRN和GWNET与当前最先进的STGNNs进行了比较,包括DGCRN、MegaCRN、STGODE、D2STGNN和DSTAGNN。
  7. 节点嵌入初始化的影响分析
    • 对AGCRN★进行了消融研究,比较了平均初始化和随机初始化对模型预测精度的影响。
  8. 与AGS方法的比较
    • 将所提出的方法与现有的AGS方法进行了比较,证明了所提出方法的优越性。
  9. T★的鲁棒性分析
    • 通过引入T★的扰动过程,研究了T★的连通性对ASTGNN建模全局空间依赖性的重要性。

这些实验全面评估了所提出方法在不同方面的表现,包括预测准确性、计算效率、收敛速度、鲁棒性等,从而为论文的主张提供了有力的实证支持。

LOSS收敛,体现更快收敛

AGS(自适应图稀疏化)与AGCRN中的方法之间的比较实验结果

AGCRN* 和 GWNET* 与当前最先进的 STGNN 相比

消融实验

扰动比为𝑝的扰动过程

Q: 总结一下论文的主要内容

A: 这篇论文的主要内容可以概括为以下几个要点:

  1. 问题提出:论文针对自适应时空图神经网络(ASTGNNs)在大规模时空数据上的训练和推理阶段存在的高计算开销问题,提出了一种新的方法来提高计算效率。
  2. 方法介绍:引入了基于彩票假设(LTH)的图中奖票(GWT)概念,通过预训练前确定星型拓扑结构作为GWT,以减少边数同时保持有效信息传播,从而降低计算复杂度。
  3. 理论支持:利用谱图理论为星型拓扑的有效性提供了理论分析和证明,证明了星型拓扑是完整图的一个良好近似,能够学习到空间时间依赖性。
  4. 实验验证:在多个大型时空数据集上进行了实验,验证了使用GWT的ASTGNNs在保持或甚至超越完整模型性能的同时,显著降低了计算成本。
  5. 效率和性能:论文的方法不仅减少了模型的计算需求,还展示了在不同数据集上与现有模型相比的可比性或优越性。
  6. 简化训练过程:通过预确定GWT,避免了传统训练过程中的迭代训练、剪枝和重训练的需要,简化了ASTGNNs的部署。
  7. GWT-AGCN层:提出了GWT-AGCN层,提高了模型的硬件兼容性和计算效率。
  8. 中心节点选择:讨论了中心节点选择的重要性,并提出了平均初始化方法来提高模型的预测精度。
  9. 未来工作:论文最后提出了一些可能的研究方向,包括长期预测、不同拓扑结构的GWT、跨领域适用性等。

出了GWT-AGCN层,提高了模型的硬件兼容性和计算效率。
8. 中心节点选择:讨论了中心节点选择的重要性,并提出了平均初始化方法来提高模型的预测精度。
9. 未来工作:论文最后提出了一些可能的研究方向,包括长期预测、不同拓扑结构的GWT、跨领域适用性等。

总的来说,这篇论文在理论和实践层面都为ASTGNNs的效率和实用性提供了显著的改进,并通过实验验证了其有效性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/38073.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python数据分析-股票分析和可视化(深证指数)

一、内容简介 股市指数作为衡量股市整体表现的重要工具,不仅反映了市场的即时状态,也提供了经济健康状况的关键信号。在全球经济体系中,股市指数被广泛用于预测经济活动,评估投资环境,以及制定财政和货币政策。在中国…

IEEE JSTSP综述:从信号处理领域分析视触觉传感器的研究

触觉传感器是机器人系统的重要组成部分,虽然与视觉相比触觉具有较小的感知面积,但却可以提供机器人与物体交互过程中更加真实的物理信息。 视觉触觉传感是一种分辨率高、成本低的触觉感知技术,被广泛应用于分类、抓取、操作等领域中。近期&a…

如何跑起来一个前后端项目

后端部署 第一步配置自己的maven 第二步优先导入自己本地jar包当本地没有在从远程下载 第三步找到配置文件 第四步成功运行后端部署完毕 前端部署 第一步看看项目node_modules有没有文件如果有就是已经安装好了对应的依赖,没有执行npm install 第二步运行即可

决策树划分属性依据

划分依据 基尼系数基尼系数的应用信息熵信息增益信息增益的使用信息增益准则的局限性 最近在学习项目的时候经常用到随机森林,所以对决策树进行探索学习。 基尼系数 基尼系数用来判断不确定性或不纯度,数值范围在0~0.5之间,数值越低&#x…

【知识学习】Unity3D中Scriptable Render Pipeline的概念及使用方法示例

Unity3D中的Scriptable Render Pipeline(SRP)是一种高度可定制的渲染管线框架,允许开发者完全控制渲染流程,以适应不同的渲染需求和硬件平台。SRP使得开发者可以编写自己的渲染逻辑,包括摄像机管理、渲染设置、光照处理…

【机器学习】K-means++: 一种改进的聚类算法详解

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 K-means: 一种改进的聚类算法详解引言1. K-means算法回顾1.1 基本概念1.2 局限性…

RDMA建链的3次握手和断链的4次挥手流程?

文章目录 基础信息建链 3次握手断链4次挥手建联状态active端passive端 报文结构函数关系其他后记 基础信息 CM: Communication Management 通信管理 连接管理SIDR: Service ID Resolution Protocol. 作用: enables users of Unreliable Datagram service to locate …

实验4 图像空间滤波

1. 实验目的 ①掌握图像空间滤波的主要原理与方法; ②掌握图像边缘提取的主要原理和方法; ③了解空间滤波在图像处理和机器学习中的应用。 2. 实验内容 ①调用 Matlab / Python OpenCV中的函数,实现均值滤波、高斯滤波、中值滤波等。 ②调…

【操作系统期末速成】 EP02 | 学习笔记(基于五道口一只鸭)

文章目录 一、前言🚀🚀🚀二、正文:☀️☀️☀️2.1 考点二:操作系统的功能及接口2.2 考点三:操作系统的发展及分类2.3 考点四:操作系统的运行环境(重要) 一、前言&#x…

从零开始三天学会微信小程序开发(三)

看到不少入门的小程序开发者不断的问重复性的问题,我们从实战角度开发了这个课程,希望能够帮助大家了解小程序开发。 课程分三天: 第一天:微信小程序开发入门第二天:给小程序接入云端数据第三天:完善我的…

MySQL高级-MVCC- readview介绍

文章目录 1、介绍2、ReadView中包含了四个核心字段:3、版本链数据的访问规则:4、不同的隔离级别,生成ReadView的时机不同: 1、介绍 ReadView(读视图)是 快照读 SQL执行时MVCC提取数据的依据,记录…

【计算机组成原理实验】——运算器组成实验

计组TEC4实验——运算器组成实验 1. 实验目的 (1)掌握算术逻辑运算加、减、乘、与的工作原理。 (2) 熟悉简单运算器的数据传送通路。 (3) 验证实验台运算器的8位加、减、与、直通功能。 (4) 验证实验台的4位乘4位功能。 (5) 按给定数据,完成几种指…

SerDes介绍以及原语使用介绍(4)ISERDESE2原语仿真

文章目录 前言一、iserdese2_module模块二、oserdese2_module模块三、顶层模块四、仿真结果分析 前言 上文详细介绍了ISERDESE2原语的使用,本文根据仿真对ISERDESE2原语的使用进一步加深印象。在仿真时,与OSERDESE进行回环。 一、iserdese2_module模块…

昇思MindSpore学习笔记4--数据集 Dataset

昇思MindSpore学习笔记4--数据集 Dataset 摘要: 昇思MindSpore数据集Dataset的加载、数据集常见操作和自定义数据集方法。 一、数据集 Dataset概念 MindSpore数据引擎基于Pipeline 数据预处理相关模块: 数据集Dataset加载原始数据,支持文本…

大创项目推荐 题目:基于机器视觉的图像矫正 (以车牌识别为例) - 图像畸变校正

文章目录 0 简介1 思路简介1.1 车牌定位1.2 畸变校正 2 代码实现2.1 车牌定位2.1.1 通过颜色特征选定可疑区域2.1.2 寻找车牌外围轮廓2.1.3 车牌区域定位 2.2 畸变校正2.2.1 畸变后车牌顶点定位2.2.2 校正 7 最后 0 简介 🔥 优质竞赛项目系列,今天要分享…

Leetcode3192. 使二进制数组全部等于 1 的最少操作次数 II

Every day a Leetcode 题目来源:3192. 使二进制数组全部等于 1 的最少操作次数 II 解法1:遍历 由于 nums[i] 会被其左侧元素的操作影响,所以我们先从最左边的 nums[0] 开始思考。 分类讨论: 如果 nums[0]1,无需反…

amis-editor 注册自定义组件

建议先将amis文档从头到尾,仔细看一遍。 参考:amis - 低代码前端框架 amis 的渲染过程是将 json 转成对应的 React 组件。先通过 json 的 type 找到对应的 Component,然后把其他属性作为 props 传递过去完成渲染。 import * as React from …

flex讲解

随着前端技术的不断发展和更新,flex布局成为前端布局的主流。但是仍然有很多前端新手搞不懂flex到底怎么用!!!今天我们就来好好讲讲flex布局 老规矩先上定义 什么是flex布局 布局的传统解决方案,基于盒状模型&#x…

郑州高校大学智能制造实验室数字孪生可视化系统平台建设项目验收

随着制造业的转型升级,智能化、信息化已成为制造业发展的必然趋势。数字孪生技术作为智能制造领域的关键技术之一,它通过构建与实体系统相对应的虚拟模型,实现对实体系统的实时监测、预测和优化,为制造业的智能化、信息化提供了强…

LitelDE安装---附带每一步截图以及测试

LiteIDE LiteIDE 是一款专为Go语言开发而设计的开源、跨平台、轻量级集成开发环境(IDE),基于 Qt 开发(一个跨平台的 C 框架),支持 Windows、Linux 和 Mac OS X 平台。LiteIDE 的第一个版本发布于 2011 年 …