AI论文速读 | 具有时间动态的路网语义增强表示学习

论文标题: Semantic-Enhanced Representation Learning for Road Networks with Temporal Dynamics

作者: Yile Chen(陈亦乐) ; Xiucheng Li(李修成); Gao Cong(丛高) ; Zhifeng Bao(鲍芝峰) ; Cheng Long(龙程)

机构:南洋理工大学(NTU),哈尔滨工业大学(深圳),皇家墨尔本理工大学(RMIT)

论文链接:https://arxiv.org/abs/2403.11495

Cool Paper:https://papers.cool/arxiv/2403.11495

TL;DR:本文提出了一个名为Toast的框架及其增强版DyToast,用于学习路网的语义增强表示,并通过结合时间动态来提升时间敏感任务的性能。

关键词:路网表示学习,轨迹预训练,自监督学习

标题和作者

🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

摘要

在这项研究中,引入了一种名为 Toast 的新颖框架,用于学习路网的通用表示,以及其改进模型 DyToast,旨在增强时间动态的集成,以提高各种时间敏感下游任务的性能。 具体来说,提出对路网固有的两个关键语义特征进行编码:交通模式和行驶语义。 为了实现这一目标,通过合并旨在预测与目标路段相关的交通环境的辅助目标来完善skip-gram模块。 此外,利用轨迹数据并基于 Transformer 设计预训练策略来提取路网上的行驶语义。进一步, DyToast 通过采用以其有益特性为特征的统一三角函数,进一步增强了该框架,从而能够更有效地捕获路网的时间演变和动态性质。 通过这些提出的技术,可以获得对路网中知识的多方面进行编码的表示,适用于基于路段的应用和基于轨迹的应用。 对三个任务中的两个现实世界数据集进行的广泛实验表明,提出的框架始终明显优于最先进的基线。

Q: 这篇论文试图解决什么问题?

A: 这篇论文提出了一个名为Toast的新颖框架及其高级版本DyToast,旨在通过增强对时间动态的整合来有效学习路网的通用表示。具体来说,该研究试图解决以下问题:

  1. 路网表示学习中的两个主要问题:与常见图假设不一致的偏差(discrepancies)和路网特征的同质性(feature uniformity)。这些问题限制了现有图表示学习方法在路网中的应用效果。
  2. 路网任务中的时间敏感性问题。许多路网任务,如交通速度预测和旅行时间估计,具有明显的动态特性,这些特性随时间变化而变化。现有的路网表示学习方法通常只学习静态表示,无法有效捕捉这些动态特征。
  3. 为了解决上述问题,论文提出了Toast框架,它包含两个模块:一个交通增强的skip-gram模块和一个基于轨迹数据的Transformer模块。这些模块通过自监督学习目标直接编码交通模式和旅行语义,无需额外的任务特定标签。
  4. 为了进一步捕捉时间动态,DyToast在Toast的基础上引入了统一的三角函数时间编码技术,使得模型能够更有效地捕捉路网的时间演变和动态特性。

总体而言,论文的目标是学习能够编码路网多方面知识(包括交通模式和旅行语义)的通用表示,这些表示不仅适用于基于道路段的应用程序,也适用于基于轨迹的应用程序,并且对时间敏感的任务具有更好的适用性。

路网示例(蓝色:主干道,绿色:次级道路)

  • 例如 d h , g h , h i , h k dh, gh,hi,hk dh,gh,hi,hk是一个十字路口,但是道路等级不同,**交通模式(Traffic pattern)**不同。
  • 差异(discrepancies)特征均匀性(feature uniformity):虽然路段de与其邻居共享特征,但由于其定位在直接路线(direct route)(路径[c、d、e、f])上,而不是绕道路线(detour)(路径[c、d、a、e、f]),它也比路段(cd、ad、ab、ab)具有更高的交通量。

Q: 有哪些相关研究?

A: 这篇论文中提到的相关研究主要分为以下几个类别:

  1. 路网表示学习 (Road Networks):
    • 研究如何从路网中学习通用的表示,以便能够提升多种下游任务的效果,例如交通推断和预测、道路属性预测等。
  2. 轨迹分析和建模 (Trajectory Analysis and Modeling):
    • 利用车辆在城市中的移动轨迹数据来提供对路网相关任务的补充见解,例如路线规划、异常检测和目的地预测。
  3. 图表示学习 (Graph Representation Learning):
    • 采用随机游走策略(如Deepwalk和node2vec)或图卷积网络(GCN)和图注意力网络(GAT)来学习图结构的表示。
  4. 路网表示学习的方法:
    • 专门针对路网的特性开发的方法,例如SRN2Vec、HRNR、RFN等,这些方法尝试捕捉路网的拓扑结构和空间信息。
  5. 基于轨迹数据的表示学习方法:
    • 例如Toast、JCLRNT和TrajRNE,这些方法通过轨迹数据来提取路网中的旅行语义,并学习道路段和轨迹的表示。
  6. 时间动态的编码:
    • 研究如何将时间动态整合到路网表示中,以适应交通速度随时间变化等动态特性。

这些相关研究为论文中提出的方法提供了理论和技术背景,并为比较和评估所提出方法的有效性提供了基准。

Q: 论文如何解决这个问题?

DyToast

(橘)红色组件是针对时间动态的设计

A: 论文提出了一个名为Toast的框架以及其增强版DyToast,用以解决路网表示学习中的问题。具体解决方案如下:

  1. 交通增强的skip-gram模块
    • 通过扩展skip-gram模型,不仅预测目标道路段的上下文邻居,还预测与交通模式相关的上下文特征(例如道路类别和限速)。
    • 采用二元交叉熵损失函数来预测目标道路段的交通上下文,并通过多任务学习范式优化道路段表示,使其能够编码图结构和交通模式。
  2. 基于轨迹数据的Transformer模块
    • 利用Transformer模型和两个新颖的预训练任务(路线恢复和轨迹判别)来提取轨迹数据中的旅行语义。
    • 路线恢复任务通过随机遮蔽轨迹中的一段连续道路段,然后基于剩余路段恢复被遮蔽的部分。
    • 轨迹判别任务旨在区分真实的轨迹和通过随机游走生成的假轨迹,以增强模型捕捉转换模式的能力。
  3. 时间动态编码技术
    • 通过使用统一的三角函数编码方法,将时间动态整合到表示学习中。
    • 构建基于每个时间帧的转移频率的时间依赖型交通图,使用带参数化的正弦函数来模拟道路段在不同时间帧的表示。
    • 在Transformer模块中,将正弦函数集成到自注意力机制中,以有效捕捉连续和不规则时间间隔的细粒度时间相关性。
  4. 实验验证
    • 在两个真实世界的数据集上进行广泛的实验,验证所提出框架的有效性。
    • 在三个时间敏感的下游任务上(道路速度推断、旅行时间估计和目的地预测)进行测试,结果表明Toast和DyToast在各种任务中均优于现有的基准方法。

通过这些方法,论文成功地提出了一种能够捕捉路网中交通模式和旅行语义的通用表示学习方法,并且通过时间编码技术增强了表示的时间动态性,使其更适合时间敏感的下游应用。

Q: 论文做了哪些实验?

数据集统计

实验结果

不同时间编码技术在交通速度推理任务上的比较

A: 论文中进行了一系列实验来验证所提出Toast和DyToast框架的有效性。具体实验内容如下:

  1. 数据集
    • 使用了两个城市(成都和西安)的路网和轨迹数据集,这些数据来自OpenStreetMap和滴滴出行公司。
  2. 比较方法
    • 与9种不同的基线方法进行比较,包括传统的图学习算法(如node2vec、GCN、GAT)、标准(standard)路网表示学习方法(如SRN2Vec、HRHR、RFN、SARN)、以及轨迹丰富(Trajectory-enriched)的表示学习方法(如TrajRNE、JCLRNT、Toast)。
  3. 下游任务
    • 评估了模型在三个时间敏感的任务上的性能:道路速度推断、旅行时间估计和目的地预测。
    • 对于道路速度推断任务,目标是预测在给定部分交通速度观测值的情况下所有道路段的动态交通速度。
    • 对于旅行时间估计任务,目标是估计在不同时间帧开始的轨迹的旅行时间。
    • 对于目的地预测任务,目标是预测在不同时间帧开始的轨迹的目的地道路段。
  4. 评估指标
    • 对于道路速度推断和旅行时间估计任务,使用平均绝对误差(MAE)和均方根误差(RMSE)作为评估指标。
    • 对于目的地预测任务,使用Top-N准确率(Acc@N)作为评估指标。
  5. 实验设置
    • 对于所有比较方法,将道路段和轨迹的表示维度设置为128。
    • 在Transformer预训练阶段,采用40%的遮蔽比率,设置Transformer的层数为2,头数为4,并进行30个训练周期的迭代。
    • 对于基线方法,遵循各自论文中描述的默认配置。
  6. 性能比较
    • 展示了所有方法在成都和西安数据集上的三个任务的结果,并进行了分析。
  7. 模型分析
    • 进行了消融研究,移除了框架的不同组件来调查它们对性能的贡献。
    • 比较了不同的时间编码技术在道路速度推断任务上的有效性。
    • 研究了超参数(如嵌入大小、遮蔽比率和辅助损失权重)对模型性能的影响。

通过这些实验,论文证明了Toast和DyToast在捕捉路网的时间动态和提高时间敏感任务性能方面的优越性。

消融实验

超参实验

Q: 总结一下论文的主要内容

A: 这篇论文主要内容的总结如下:

  1. 问题定义:论文针对路网表示学习中存在的两个主要问题——图假设的不一致性(discrepancies)和特征同质性(feature uniformity),以及缺乏对时间动态的捕捉,提出了新的解决方案。
  2. 方法提出
    • Toast框架:一个新颖的框架,包含两个核心模块——交通增强的skip-gram模块和基于轨迹数据的Transformer模块,用于学习路网的通用表示。
    • DyToast框架:Toast的增强版,通过引入统一的三角函数时间编码技术,能够捕捉路网的时间演变和动态特性。
  3. 技术细节
    • 交通增强的skip-gram模块:通过辅助目标预测交通上下文,编码交通模式到路网表示中。
    • Transformer模块:利用预训练任务(路线恢复和轨迹判别)从轨迹数据中提取旅行语义。
    • 时间动态编码:采用正弦函数对表示进行时间参数化,以整合时间信息并捕捉动态模式。
  4. 实验验证
    • 在两个真实世界的数据集上进行实验,包括成都和西安的路网和轨迹数据。
    • 与多种基线方法进行比较,包括传统图学习方法和专门针对路网的方法。
    • 在三个时间敏感的下游任务上评估模型性能:道路速度推断、旅行时间估计和目的地预测。
  5. 结果分析
    • DyToast在所有任务中均优于现有的基准方法,证明了其在捕捉时间动态方面的优势。
    • 消融研究和超参数影响分析进一步验证了所提出技术的有效性。
  6. 贡献总结
    • 提出了一个能够学习路网通用表示的新框架,该框架能够整合交通模式和旅行语义,并增强对时间动态的捕捉。
      st在所有任务中均优于现有的基准方法,证明了其在捕捉时间动态方面的优势。
    • 消融研究和超参数影响分析进一步验证了所提出技术的有效性。
  7. 贡献总结
    • 提出了一个能够学习路网通用表示的新框架,该框架能够整合交通模式和旅行语义,并增强对时间动态的捕捉。
    • 在真实世界数据集上的广泛实验表明,所提出的方法在多种时间敏感的下游任务中均能取得显著的性能提升。

🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/771062.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

web前端性能优化【多年工作经验总结,一举拿下】

浏览器方面: 减少HTTP请求 HTTP 请求是指客户端(例如浏览器)向服务器发出的请求消息,用于获取特定资源或执行特定操作 为什么能够优化性能? 减少网络延迟:每次发起HTTP请求都需要经过网络传输&#xff…

openlayers 入门教程(五):sources 篇

还是大剑师兰特:曾是美国某知名大学计算机专业研究生,现为航空航海领域高级前端工程师;CSDN知名博主,GIS领域优质创作者,深耕openlayers、leaflet、mapbox、cesium,canvas,webgl,ech…

利用云手机技术,开拓海外社交市场

近年来,随着科技的不断进步,云手机技术逐渐在海外社交营销领域崭露头角。其灵活性、成本效益和全球性特征使其成为海外社交营销的利器。那么,究竟云手机在海外社交营销中扮演了怎样的角色呢? 首先,云手机技术能够消除地…

UE4 根据任意多个点,生成最近的线条

1.计算所有线条的组合 2.Clear0宏:清除掉数组Distance0的值。注意这里是设置成最大值,而不是使用Clear! 3.清除掉数组中的最小值,避免重复生成相同长度的线条。注意这里是设置成最大值,而不是使用Clear! …

接口关联和requests库

一、接口关联 postman的接口 postman的接口关联配置:js代码,重点在于思路。 // 定义jsonData这个变量 接受登录接口的返回结果 var jsonData JSON.parse(responseBody); // 从返回结果里提取token/id值,并赋值给token/id变量值作为环境变…

如何添加随机种子保证代码每次复现的一致性?

如何添加随机种子保证代码每次复现的一致性? 在main()程序中首先设定随机种子: def set_seed(seed42):os.environ[PYTHONHASHSEED] str(seed)random.seed(seed)np.random.seed(seed)torch.manual_seed(seed)torch.cuda.manual_seed(seed)torch.backends…

Spark基于DPU Snappy压缩算法的异构加速方案

一、总体介绍 1.1 背景介绍 Apache Spark是专为大规模数据计算而设计的快速通用的计算引擎,是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些不同之处使 Spark 在某些工作负载方面表现得更加优越。换句话说&am…

Java毕业设计 基于SSM网上二手书店系统

Java毕业设计 基于SSM网上二手书店系统 SSM jsp 网上二手书店系统 功能介绍 用户:首页 图片轮播 图书查询 图书分类显示 友情链接 登录 注册 图书信息 图片详情 评价信息 加入购物车 资讯信息 资讯详情 个人中心 个人信息 修改密码 意见信息 图书收藏 已经付款 邮…

数据仓库的魅力及其在企业中的应用实践

数据仓库,这一创新性的概念来自于比尔恩门,从1980年代末提出以来,便凭借其独特的架构设计和强大的数据处理能力,在全球商业领域中掀起了一场革命。它不仅是解决企业海量数据存储和查询需求的关键技术,更是推动企业实现…

rel=“dns-prefetch“和rel=“preconnect“ 结合使用,以及link属性的详细介绍

使用 dns-prefetch DNS-prefetch 尝试在请求资源之前解析域名。这可能是后面要加载的文件,也可能是用户尝试打开的链接目标。 为什么要使用 dns-prefetch? 当浏览器从(第三方)服务器请求资源时,必须先将该跨源域名解…

从人工智能入门到理解ChatGPT的原理与架构的第一天(First)(含机器学习特征工程详解)

目录 一.ChatGPT的发展历程 二.Attention is all you need 三.对于GPT-4的智能水平评估 四.大语言模型的技术演化 1.从符号主义到连接主义 2.特征工程 2.1数据探索 2.2数据清洗 2.3数据预处理 2.3.1无量纲化 2.3.1.1标准化 2.3.1.2区间缩放法 2.3.1.3标准化与归一…

李宏毅深度强化学习导论——策略梯度

引言 这是李宏毅老师深度强化学习视频的学习笔记,主要介绍策略梯度的概念,在上篇文章的末尾从交叉熵开始引入策略梯度。 如何控制你的智能体 上篇文章末尾我们提到了两个问题: 如何定义这些分数 A A A,即定义奖励机制&#xff…

11.数据库技术(上)

函数依赖、规范化这类难的知识点,考的少; 基本概念、sql语句、关系代数运算、关系代数运算与sql语句的转换,考的多; 主要议题:

redis实际应用场景及并发问题的解决

业务场景 接下来要模拟的业务场景: 每当被普通攻击的时候,有千分之三的概率掉落金币,每回合最多爆出两个金币。 1.每个回合只有15秒。 2.每次普通攻击的时间间隔是0.5s 3.这个服务是一个集群(这个要求暂时不实现) 编写接口&…

如果有意外,这个窗口就会弹出,希望你们能够看到!——夜读(逆天打工人爬取热门微信文章解读)

第一个日二更 引言Python 代码第一篇 定时任务运行结果 第二篇 人民日报 【夜读】最好的教养,是对家人和颜悦色结尾 时间不会无缘无故增加 也不会无缘无故减少 我们唯一能够控制就是 加大时间的密度 引言 为了不让我在大庭广众下大喊我是沙比 我来更新文章啦 这次带…

nysm:一款针对红队审计的隐蔽型后渗透安全测试容器

关于nysm nysm是一款针对红队审计的隐蔽型后渗透安全测试容器,该工具主要针对的是eBPF,能够帮助广大红队研究人员在后渗透测试场景下保持eBPF的隐蔽性。 功能特性 随着基于eBPF的安全工具越来越受社区欢迎,nysm也应运而生。该工具能保持各种…

帮企建站宝响应式建站源码系统 带完整安装代码包以及搭建教程

在当今数字化时代,拥有一个功能强大且用户友好的网站是企业成功的重要基石。为了满足广大企业对于快速搭建高质量网站的需求,罗峰给大家分享一款“帮企建站宝响应式建站源码系统”。这一系统不仅包含了完整的安装代码包,还配备了详尽的搭建教…

数据库系统概论(超详解!!!) 第四节 关系数据库标准语言SQL(Ⅲ)

1.连接查询 连接查询&#xff1a;同时涉及多个表的查询 连接条件或连接谓词&#xff1a;用来连接两个表的条件 一般格式&#xff1a; [<表名1>.]<列名1> <比较运算符> [<表名2>.]<列名2> [<表名1>.]<列名1> BETWEEN [&l…

QT(6.5) cmake构建C++编程,调用python (已更新:2024.3.23晚)

一、注意事项 explicit c中&#xff0c;一个参数的构造函数(或者除了第一个参数外其余参数都有默认值的多参构造函数)&#xff0c;承担了两个角色&#xff0c;构造器、类型转换操作符&#xff0c; c提供关键字explicit&#xff0c;阻止转换构造函数进行的隐式转换的发生&#…

mysql增量备份与修复

MySQL数据库增量恢复 1.一般恢复 将所有备份的二进制日志内容全部恢复 2.基于位置恢复 数据库在某一时间点可能既有错误的操作也有正确的操作 可以基于精准的位置跳过错误的操作 发生错误节点之前的一个节点&#xff0c;上一次正确操作的位置点停止 3.基于时间点恢复 跳过…