UrbanGPT: Spatio-Temporal Large Language Models

1.文章信息

本次介绍的文章是2024年arxiv上一篇名为《UrbanGPT: Spatio-Temporal Large Language Models》的文章,UrbanGPT旨在解决城市环境中的时空预测问题,通过大语言模型(LLM)的强大泛化能力来应对数据稀缺的挑战。

2.摘要

UrbanGPT是一种旨在解决城市时空预测问题的大型语言模型。时空预测的目标是预测城市生活各个方面的未来时空模式、趋势和事件,包括交通、人口流动和犯罪率。现有方法虽然在时空数据预测方面有一定成效,但大多依赖于大量的标注数据,这在实际的城市感知场景中往往难以获取。数据稀疏性是一个普遍存在的问题,在某些情况下,甚至难以收集任何标注数据,从而进一步加剧了这个问题。因此,构建一个能够在不同时空学习场景中展示出强泛化能力的时空模型变得至关重要。

受到大语言模型(LLMs)在处理文本数据方面显著成果的启发,UrbanGPT的目标是创建一个能够在广泛的下游城市任务中展现出卓越的泛化能力的时空LLM。为此,我们提出了UrbanGPT,改模型无缝集成了时空依赖编码器和指令微调范式,使得LLMs能够理解时间和空间之间的复杂相互依赖关系,从而在数据稀疏的情况下也能进行更全面和准确的预测。我们在各种公共数据集上进行了广泛的实验,涵盖不同的时空预测任务,结果一致表明,所设计的UrbanGPT始终优于最先进的基准模型。这些发现突显了在标记数据稀疏的零样本情景下构建大型语言模型进行时空学习的潜力。

3.介绍

时空预测在城市环境中的应用至关重要,如交通流量、人口移动和犯罪率预测。然而,现有方法依赖于大量标注数据,而实际应用中数据稀疏是一个普遍问题。因此,构建能够在数据稀疏情况下表现出色的时空预测模型成为一个重要挑战。   

本文的主要贡献如下:

(1) 据我们所知,这是首次尝试开发一种能够在不同数据集上预测各种城市现象的时空大语言模型,尤其是在训练样本受限的情况下。

(2) 本文提出了时空预测框架UrbanGPT,它使得大语言模型能够理解时空之间错综复杂的相互依赖关系。通过将时空依赖编码器无缝集成到指令微调范式中,有效地将时空上下文与大语言模型相结合。

(3) 在现实世界数据上进行的大量实验证明了本文提出的UrbanGPT在零样本时空学习场景中具有出色的泛化能力。这些发现突显了该模型的强大泛化能力,表明它在准确预测和理解时空模式方面的有效性,即使在零样本场景下也是如此。

4.预备知识

时空数据

时空数据通常表示为三维张量𝑋∈ℝ𝑅×𝑇×𝐹,每个元素𝑋𝑟,𝑡,𝑓代表在𝑟区域𝑡时间段内的第𝑓个特征值。例如,预测城市区域内出租车流量的场景中,数据表示特定区域在给定时间段内的出租车进出流量。

时空预测

在时空预测任务中,通常使用历史数据预测未来趋势。具体目标是根据前𝐻步信息预测接下来的𝑃步数据,模型𝑓(·)通过历史数据进行训练。时空预测任务主要分为两类:回归预测(例如交通流量或出租车需求预测)和分类预测(例如犯罪发生预测)。

ea65414702266d7211b963f3fb65f82c.png

时空零样本学习

尽管现有时空学习方法有效,但在泛化到广泛的下游时空学习场景中常遇到困难。本研究旨在解决时空零样本场景,即在未见过的数据集或任务中进行预测。在这种情况下,预测函数22920947343d9eb187eb35041545c16c.png负责预测从未遇见过的下游任务中的时空数据b46b0485b3ce304b93cd1f74ec406991.png

ee67ed5e8dd675557b369673e58bff4b.png

5.方法    

412703e1f675570cc5e4feda3d2b199f.png图图1 UrbanGPT整体框架

5.1时空依赖编码器

大型语言模型在语言处理方面表现出卓越的能力,但它们在理解时空数据中固有的时间演变模式方面面临挑战。为了克服这一限制,我们提出通过集成一个多层次时间卷积网络的时空编码器来增强大语言模型捕捉时空上下文中的时间依赖性的能力。时空编码器由两个关键组件组成:门控扩散卷积层和多层次关联注入层。让我们将这种架构形式化为:

096a35a9d3034585baccfda3c1375dc9.png

𝐸𝑟∈𝑅𝑇×𝑑为时空嵌入,这个嵌入是通过一个线性层增强原始数据𝑋获得的。为了解决梯度消失的问题,使用𝐸𝑟的一个切片,记为𝐸𝑟′(𝑙)∈𝑅𝑇′×𝑑,这个切片由膨胀卷积核的大小决定,用于执行残差操作。执行残差操作时使用1-D空洞卷积核Wk𝑊𝑔∈𝑅𝑇𝑔×𝑑𝑖𝑛×𝑑𝑜𝑢𝑡,以及相应的偏置项bkbg∈𝑅𝑑𝑜𝑢𝑡。sigmoid激活函数𝛿被用来控制在重复卷积操作中信息保存的程度。在门控时间膨胀卷积层编码之后,我们能够有效地捕捉跨多个时间步的时间依赖性,从而产生时间表示。

这些表示包含不同级别的时间依赖性,反映了各种粒度感知的时间演变模式。为了保存这些信息丰富的模式,我们引入了一个多层次关联注入层。这一层旨在将不同层次之间的相关性结合起来,形式化为:

e7dd4ad653abe971fc4ac54a27af194c.png    

其中W𝑠∈𝑅𝑇s×𝑑out×𝑑𝑜𝑢𝑡'是卷积核,经过L层编码后,我们使用一个简单的线性层融合门控扩散卷积层和多层次关联注入层的结果,最终的时空依赖性表征为0f74a184605c0c1f7aaaaff4f5ef11c3.png,为了解决下游可能出现的各种城市场景集,本文提出的时空编码器在建模空间相关性时独立于图结构。因为在零样本预测环境中,实体之间的空间关系可能是未知的或难以确定的。这确保UrbanGPT在广泛的城市环境中的适用性。

5.2时空指令微调框架

时空数据-文本对齐

为了使语言模型能够有效地理解时空模式,对齐文本和时空信息至关重要。这允许模型融合不同模态,从而产生信息更丰富的表示。通过集成文本和时空域的上下文特征,模型可以捕获互补信息并提取更具表示能力的高层语义表示c1e86bc0cbb153734a853c5221351ce0.png。为实现这一点,本文利用轻量级对齐模块来投影时空依赖性表示。投影操作采用线性层参数Wp∈𝑅d×𝑑L进行,其中dL表示大语言模型常用的隐藏维度。所得到的投影H∈𝑅R×F×𝑑L,在指令中使用特殊的标记表示为:<ST_start>,<ST_HIS>,...,<ST_HIS>,<ST_end>。其中,<ST_start>和<ST_end>为标识时空标记的开始和结束的标识符,这些标识符可以通过扩展其词汇量来包含在大语言模型中。占位符表示时空标记,对应于隐藏层中的投影H。通过使用该技术,模型获得了识别时空依赖性的能力,从而提高了其在城市场景中成功执行时空预测任务的能力。

时空指令提示

在时空预测的场景中,时间和空间信息都包含了有价值的语义细节,有助于模型理解特定上下文下的时空模式。例如,清晨和高峰时间段的交通流量有很大的不同,并且商业区和住宅区之间的交通模式也存在差异。因此,将时间和空间信息表示为提示文本的对时空预测任务是有益的,我们利用大语言模型的文本理解能力来编码这些信息。在UrbanGPT框架中,我们集成了多粒度的时间信息和空间细节,作为大语言模型的指令输入。时间信息包括一周的日期和时间等因素,而区域信息包括城市、行政区域和附近的兴趣点(POI)数据等,如下图所示。通过合并这些不同的元素,UrbanGPT能够识别和理解复杂的时空环境下不同区域和时段的时空模式,从而增强其零样本推理能力。   

4bbded72b9bf7b509bdc69c3668a1cd4.png

图2 编码时间和位置感知信息的时空提示指令

大预言模型的时空指令微调

使用指令微调LLMs以生成文本格式的时空预测存在两个挑战。首先,时空预测通常依赖于数值数据,其结构和模式与语言模型擅长处理的自然语言不同,后者侧重于语义和句法关系。其次,LLMs通常使用多分类损失进行预训练以预测词汇,从而得到潜在结果的概率分布。而回归任务则需要连续值分布。为了解决这些挑战,UrbanGPT采用了一种不同的策略,不直接预测未来的时空值,而是生成辅助预测过程的预测标记。这些标记随后通过回归层,将隐藏表示映射为生成更准确的预测值:

16f2f9e58aeccb7e6cbcfe11d81e7cbe.png

上式中预测标记的隐藏表征表示为𝛤𝑟,𝑓∈𝑅𝑑𝐿,其中预测标记可通过扩充大语言模型词表的方式引入。W1,W2,W3为回归层的权重矩阵,[⋅,⋅]为拼接操作。

6.实验

实验包括(1) 零样本预测性能:相同城市内未见区域的预测、跨城市预测任务;(2) 典型的有监督预测任务;(3) 消融实验:时空上下文影响、使用多个数据集进行指令微调的影响、时空编码器的影响和指令微调中的回归层;(4) 模型鲁棒性研究;(5) 案例研究   

ca596c0e8db6244f352091a9f6c4f535.png

图3 跨区域零样本预测场景性能比较

4992467803a110bb4d4d0e8621edc2d4.png

图4 跨城市零样本预测场景性能比较

016e973b539ddd9058ce9ca636f08572.png

图5 端到端有监督设置下的预测性能评估

4b764a2a4515edb66f2bf3792d673bd0.png

图6 消融实验    

d7c9deb8efc071ea096989522a430adc.png

图7 鲁棒性研究

9d332e1e4e6f674848e220faef8e7a0e.png

图8 案例研究

7. 总结与展望

本文提出了UrbanGPT,一个能够在不同的城市场景中具有良好泛化能力的时空大型语言模型。为实现时空上下文信号与LLMs无缝对齐,本文引入了一种时空指令微调范式。这赋予UrbanGPT在各种类型的城市数据中学习通用和可迁移的时空模式的卓越能力。大量实验分析展示了UrbanGPT架构及其关键组件的卓越有效性。   

然而,需要注意的是,虽然结果是令人鼓舞的,但在未来的研究中仍然存在待解决的限制。作为第一步,我们积极收集更多种类的城市数据,以增强和完善UrbanGPT在更广泛的城市计算领域的能力。此外,理解UrbanGPT的决策过程也是重要的。虽然该模型表现出卓越的性能,但提供可解释性同样重要。未来的研究也将集中于赋予UrbanGPT模型解释其预测的能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/40103.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

昇思MindSpore学习总结九——FCN语义分割

1、语义分割 图像语义分割&#xff08;semantic segmentation&#xff09;是图像处理和机器视觉技术中关于图像理解的重要一环&#xff0c;AI领域中一个重要分支&#xff0c;常被应用于人脸识别、物体检测、医学影像、卫星图像分析、自动驾驶感知等领域。 语义分割的目的是对图…

【楚怡杯】职业院校技能大赛 “Python程序开发”赛项样题三

Python程序开发实训 &#xff08;时量&#xff1a;240分钟&#xff09; 中国XX 实训说明 注意事项 1. 请根据提供的实训环境&#xff0c;检查所列的硬件设备、软件清单、材料清单是否齐全&#xff0c;计算机设备是否能正常使用。 2. 实训结束前&#xff0c;在实训平台提供的…

从数据到智能,英智私有大模型助力企业实现数智化发展

在数字化时代&#xff0c;数据已经成为企业最重要的资源。如何将这些数据转化为实际的业务价值&#xff0c;是每个企业面临的重要课题。英智利用业界领先的清洗、训练和微调技术&#xff0c;对企业数据进行深度挖掘和分析&#xff0c;定制符合企业业务场景的私有大模型&#xf…

筛选有合并单元格的数据

我们经常会使用合并单元格&#xff0c;比如下面表格&#xff0c;因为一个部门中会有不同的员工&#xff0c;就会出现如下表格&#xff1a; 但是当按部门去筛选的时候&#xff0c;会发现并不是我们预期的结果&#xff0c;部门列有空值&#xff0c;每个部门只有第一行数据可以被…

虚幻引擎 快速的色度抠图 Chroma Key 算法

快就完了 ColorTolerance_PxRange为容差&#xff0c;这里是0-255的输入&#xff0c;也就是px单位&#xff0c;直接用0-1可以更快 Key为目标颜色

PySide6 实现资源的加载:深入解析与实战案例

目录 1. 引言 2. 加载内置资源 3. 使用自定义资源文件&#xff08;.qrc&#xff09; 创建.qrc文件 编译.qrc文件 加载资源 4. 动态加载UI文件 使用Qt Designer设计UI 加载UI文件 5. 注意事项与最佳实践 6. 结论 在开发基于PySide6的桌面应用程序时&…

什么是 DDoS 攻击及如何防护DDOS攻击

自进入互联网时代&#xff0c;网络安全问题就一直困扰着用户&#xff0c;尤其是DDOS攻击&#xff0c;一直威胁着用户的业务安全。而高防IP被广泛用于增强网络防护能力。今天我们就来了解下关于DDOS攻击&#xff0c;以及可以防护DDOS攻击的高防IP该如何正确选择使用。 一、什么是…

个人引导页+音乐炫酷播放器(附加源码)

个人引导页音乐炫酷播放器 效果图部分源码完整源码领取下期更新内容 效果图 部分源码 //网站动态标题开始 var OriginTitile document.title, titleTime; document.addEventListener("visibilitychange", function() {if (document.hidden) {document.title "…

Python学习从0开始——Kaggle实践可视化001

Python学习从0开始——Kaggle实践可视化001 一、创建和加载数据集二、数据预处理1.按name检查&#xff0c;处理重复值&#xff08;查重&#xff09;2.查看存在缺失值的列并处理&#xff08;缺失值处理&#xff09;2.1按行或列查看2.2无法推测的数据2.3可由其它列推测的数据 3.拆…

QT实现GIF动图显示(小白版,可直接copy使用)

需要你自己提前设置好动图的位置&#xff0c;本例中存放于"/Users/PLA/PLA/PLA.gif widget.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QMovie> #include <QLabel>class Widget : public QWidget {Q_OBJECTpublic:explicit Wid…

深入分析 Android BroadcastReceiver (九)

文章目录 深入分析 Android BroadcastReceiver (九)1. Android 广播机制的扩展应用与高级优化1.1 广播机制的扩展应用1.1.1 示例&#xff1a;有序广播1.1.2 示例&#xff1a;粘性广播1.1.3 示例&#xff1a;局部广播 1.2 广播机制的高级优化1.2.1 示例&#xff1a;使用 Pending…

空调计费系统是什么,你知道吗

空调计费系统是一种通过对使用空调的时间和能源消耗进行监测和计量来进行费用计算的系统。它广泛应用于各种场所&#xff0c;如家庭、办公室、商场等&#xff0c;为用户提供了方便、准确的能源使用管理和费用控制。 可实现功能 智能计费&#xff1a;中央空调分户计费系统通过智…

SOLIDWORKS分期许可(订阅形式),降低前期的投入成本!

SOLIDWORKS 分期许可使您能够降低前期软件成本&#xff0c;同时提供对 SOLIDWORKS 新版本和升级程序的即时访问&#xff0c;以及在每个期限结束时调整产品的灵活性&#xff0c;帮助您跟上市场需求和竞争压力的步伐。 目 录&#xff1a; ★ 1 什么是SOLIDWORKS分期许可 ★ 2 …

gen_region_line 生成直线

gen_region_line (Operator) Name 名称 gen_region_line — Store input lines as regions.将输入行存储为region。 生成直线&#xff0c;直线区域 Signature 签名 gen_region_line( : RegionLines : BeginRow, BeginCol, EndRow, EndCol : ) Description 描述 运算符ge…

【LLM大模型】程序员为什么要学习大模型应用开发?

0 prompt engineer 就是prompt工程师它的底层透视。 1 学习大模型的重要性 底层逻辑 人工智能大潮已来&#xff0c;不加入就可能被淘汰。就好像现在职场里谁不会用PPT和excel一样&#xff0c;基本上你见不到。你问任何一个人问他会不会用PPT&#xff0c;他都会说会用&#…

请查收!模拟电路精选书单一份(可下载)

在电子工程的广阔天地中&#xff0c;模拟电路设计是一门艺术&#xff0c;也是一种科学。它要求设计师不仅要有深厚的理论知识&#xff0c;还要有精湛的实践技能。随着技术的发展&#xff0c;模拟电路设计领域不断涌现新的理论、技术和工具&#xff0c;这使得学习和掌握模拟设计…

css使用伪元素after或者before的时候想要给after设置z-index无效

css使用伪元素after或者before的时候想要给after或者before设置一个层级关系&#xff0c;使该伪类写入的样式在box的下面&#xff0c;发现给box设置z-index无效&#xff0c; 需要找到父级元素&#xff0c;在父级元素上设置z-index值并且将伪类设置z-index:-1

开放式耳机哪个牌子好?五款优质产品推荐,老司机带飞!

后台有粉丝滴滴我说&#xff0c;还想再多分享一些耳机的测评或者选购指南&#xff0c;开放式耳机确实越来越火了&#xff0c;市面上的品牌从十几块到几千块的开放式耳机也比比皆是&#xff0c;但是要选择适合自己的一款开放式耳机确实还挺难的&#xff0c;所以作为耳机测评师这…

深入解析大型语言模型:从训练到部署大模型

简介 随着数据科学领域的深入发展&#xff0c;大型语言模型——这种能够处理和生成复杂自然语言的精密人工智能系统—逐渐引发了更大的关注。 LLMs是自然语言处理&#xff08;NLP&#xff09;中最令人瞩目的突破之一。这些模型有潜力彻底改变从客服到科学研究等各种行业&…

SAP-SD同一物料下单价格确不同

业务说明&#xff1a; 业务部门反馈&#xff0c;同一物料下销售订单时&#xff0c;价格确不同。 那么这个价格是怎么取到的呢&#xff1f; 逻辑说明&#xff1a; 1、首先查看销售订单 可以看到相同物料价格是不同的&#xff0c;条件类型都是ZPR5&#xff0c;但是客户是不同…