AI论文速读 | UniST：提示赋能通用模型用于城市时空预测

本文是时空领域的统一模型——UniST，无独有偶，时序有个统一模型新工作——UniTS，感兴趣的读者也可以阅读今天发布的另外一条。

论文标题：UniST: A Prompt-Empowered Universal Model for Urban Spatio-Temporal Prediction

作者：Yuan Yuan（苑苑）, Jingtao Ding（丁璟韬）, Jie Feng（冯杰）, Depeng Jin（金德鹏）, Yong Li（李勇）

机构：清华大学

论文链接：https://arxiv.org/abs/2402.11838

Cool Paper：https://papers.cool/arxiv/2402.11838

TL,; DR：本文提出了UniST，一个基于提示的通用模型，通过灵活处理多样化时空数据、有效的生成预训练和时空知识引导的提示，实现了在多个城市和领域中的卓越泛化能力和城市时空预测性能。

关键词：时空预测，通用模型，预训练，提示微调，零样本学习，小样本学习
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘！🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

标题和作者

摘要

城市时空预测对于交通管理、资源优化和城市规划等明智决策至关重要。尽管预训练基础模型在自然语言已经取得了显着的突破，其中通用模型可以处理跨不同领域的多项任务，但城市时空建模仍然落后。现有的城市预测方法通常是针对特定的时空场景量身定制的，需要特定于任务的模型设计和广泛的域内训练数据。在这项工作中，提出了一种用于城市时空预测的通用模型 UniST。从大语言模型中汲取灵感，UniST 通过以下方式取得成功：(i) 针对不同时空数据特征的灵活性，(ii) 通过精心设计的掩码（mask）策略进行有效的生成预训练，以捕获复杂的时空关系，(iii) 时空关系知识引导的提示，可以跨场景对齐和利用内在的和共享的知识。这些设计共同释放了具有强大泛化能力的时空预测的全能（one-for-all）模型的潜力。在 15 个城市和 6 个领域进行的广泛实验证明了 UniST 在提升最先进的预测性能方面的普遍性，特别是在小样本和零样本场景中。

从传统的单独深度模型到城市时空预测的全能通用模型。

Q: 这篇论文试图解决什么问题？

A: 这篇论文提出了一个名为UniST的通用模型，旨在解决城市时空预测的问题。城市时空预测对于诸如交通管理、资源优化和城市规划等知情决策至关重要。尽管自然语言的预训练基础模型在处理多种任务方面取得了显著突破，但城市时空建模领域尚未经历类似的进步。现有的城市预测方法通常针对特定的时空场景定制，需要特定任务的模型设计和大量的领域内训练数据。UniST模型通过以下几个方面来解决这些问题：

灵活性：UniST能够适应多样化的时空数据特征。
有效的生成预训练：通过精心设计的掩码策略来捕捉复杂的时空关系。
时空知识引导的提示（Spatio-Temporal Knowledge-Guided Prompts）：通过这些提示在不同场景之间对齐和利用内在的共享知识。

这些设计共同解锁了一个适用于所有场景的通用模型的潜力，该模型具有强大的泛化能力。通过在15个城市和6个领域的广泛实验，论文展示了UniST在推进最先进的预测性能方面的普遍性，特别是在小样本（few-shot）和零样本（zero-shot）场景中。

Q: 有哪些相关研究？

A: 这篇论文中提到的相关研究主要集中在以下几个方面：

城市时空预测（Urban Spatio-Temporal Prediction）:
- 利用深度学习技术进行城市活动动态模式的建模和预测，包括CNN、RNN、ResNet、GNN、Transformer、MLP和扩散模型等架构。
基础模型（Foundation Models）:
- 探索自然语言处理（NLP）和计算机视觉（CV）领域的基础模型在城市场景中的应用，如TransGPT、CityGPT、TrafficGPT等，它们在处理基于语言的时空任务方面表现出色。
提示微调技术（Prompt Tuning Techniques）:
- 在NLP和CV领域中，提示技术已被证明能够增强预训练模型在特定任务或领域的泛化能力。这项研究与提示微调相一致，其中时空提示根据时空属性通过提示网络自适应生成。
时空数据和时间序列:
- 研究了基础模型在时间序列建模中的应用，尽管时间序列通常具有简单的1D结构，但时空数据在空间和时间维度上呈现更复杂的性质。
迁移学习和元学习（Transfer Learning and Meta-Learning）:
- 一些研究探索了在城市之间进行转移学习的方法，但这些方法通常仍需要目标城市中的一定量的训练样本。
模型泛化（Model Generalization）:
- 论文中提出的UniST模型旨在实现跨不同城市和领域的训练和预测，提供通用解决方案，这与现有解决方案相比是一个重大突破。

这些相关研究为UniST模型的提出提供了背景和基础，UniST模型通过结合这些领域的最新进展，旨在提高城市时空预测的准确性和泛化能力。

Q: 论文如何解决这个问题？

UniST

包含两部分：

大规模时空预训练
时空知识引导的提示微调

提示生成过程

A: 论文通过提出UniST模型来解决城市时空预测的问题，具体方法如下：

数据收集与处理：
- 收集来自多个城市和领域的丰富时空数据，以确保模型能够从多样化的数据中学习。
- 使用时空标记器（Spatio-Temporal Tokenizers）将不同形状的数据转换为统一的序列格式，以便利用Transformer架构。
模型架构设计：
- 采用基于Transformer的编码器-解码器架构作为基础模型。
- 引入时空自监督预训练（Spatio-temporal Self-supervised Pretraining），通过不同的掩码策略来增强模型捕捉时空关系的能力。
预训练策略：
- 采用掩码token建模（Masked Token Modeling）作为预训练策略，使用不同的掩码策略来捕捉多级别的时空关系。
- 包括随机掩码、管道掩码（Tube masking）、块掩码（Block masking）和时间掩码（Temporal Masking）。
时空知识引导的提示微调：
- 引入一个提示网络（Prompt Network），该网络根据时空域知识生成有用的提示。
- 定义了空间记忆池和时间记忆池，用于存储有关时空域知识的有价值信息。
- 通过优化这些记忆池，模型能够自适应地选择对预测最有用的信息。
实验验证：
- 在15个城市和6个领域的数据集上进行了广泛的实验，验证了UniST模型在多种预测任务上的性能。
- 特别是在小样本和零样本场景下，UniST展示了其优越的可转移性。

通过这些方法，UniST模型能够在不同的城市和领域中实现强大的泛化能力，即使在只有有限或没有训练数据的情况下也能进行有效的预测。这标志着从传统的独立方法向预训练基础模型转变的一个重要步骤。

时空预训练&提示微调伪代码

Q: 论文做了哪些实验？

短期预测

短时预测：预测6步（参考Time-LLM和PatchTST）

长期预测

长时预测：预测64步（参考Time-LLM和PatchTST）

小样本和零样本性能

1%和5%的小样本，零样本类似于迁移

A: 论文中进行了一系列实验来验证UniST模型的性能和通用性，具体包括：

短期预测（Short-Term Prediction）:
- 在多个时空数据集上评估UniST模型的短期预测性能。
- 将UniST与其他先进的时空预测模型进行比较，包括基于启发式的方法（如历史平均HA和ARIMA）、深度城市预测方法（如STResNet、ACFM等）、视频预测方法（如PredRNN、MAU等）和多变量时间序列预测方法（如PatchTST、iTransformer等）。
长期预测（Long-Term Prediction）:
- 扩展输入步长和预测范围，以评估模型在捕捉长期依赖性方面的能力。
- 同样与其他模型进行比较，以展示UniST在长期预测任务上的性能。
小样本预测（Few-Shot Prediction）:
- 在训练过程中，仅使用1%、5%和10%的训练数据，以测试模型在小样本情况下的泛化能力。
- 与具有相对较好性能的基线模型进行比较，以及与元学习基线（如MAML和MetaST）和预训练微调方法（如PatchTST）进行比较。
零样本预测（Zero-Shot Prediction）:
- 在未见过的数据集上评估UniST模型，以测试其在没有目标城市训练数据的情况下的适应能力。
- 与小样本预测设置下的基线模型进行比较，以展示UniST的零样本学习能力。
消融研究（Ablation Study）:
- 研究了UniST模型中不同组件的影响，特别是空间和时间提示对最终性能的贡献。
- 通过移除提示中的特定时空属性（如空间接近性、空间层次性、时间周期性和时间接近性）来评估每个属性的重要性。
提示学习器分析（Prompt Learner Analysis）:
- 对提示学习器进行深入分析，包括使用t-SNE可视化空间和时间记忆池中的嵌入，以及分析记忆池中嵌入的模式。
可扩展性分析（Scalability Analysis）:
- 分析模型参数大小对训练损失和预测性能的影响，以评估UniST模型的可扩展性。

这些实验结果表明，UniST在多种预测任务中均取得了先进的性能，特别是在小样本和零样本场景下，证明了其作为一种通用模型的有效性和适用性。

Q: 有什么可以进一步探索的点？

A: 论文提出的UniST模型虽然在城市时空预测方面取得了显著的成果，但仍有一些方向可以进行进一步的探索：

多样化的时空数据格式：
- 目前UniST主要依赖于基于网格的空间划分。未来的研究可以探索如何整合不同类型的时空数据，例如基于序列的数据、基于图的数据以及其他非结构化数据。
更复杂的时空关系建模：
- 尽管UniST通过不同的掩码策略捕捉了多尺度的时空关系，但仍有可能通过更先进的图网络、注意力机制或其他创新的神经网络架构来进一步提升模型的时空建模能力。
跨领域和跨城市的泛化能力：
- 尽管UniST在多个城市和领域展示了良好的泛化能力，但进一步研究如何提高模型在面对更大范围、更多种类的城市数据时的泛化性和适应性仍然是一个有趣的方向。
实时预测和动态更新：
- 研究如何将UniST应用于实时预测场景，并探索如何有效地对模型进行动态更新，以适应城市动态变化的环境。
解释性和可解释性：
- 提高模型的解释性，使决策者能够理解模型的预测结果背后的原理，这对于实际应用中的模型部署至关重要。
模型效率和优化：
- 探索如何减少模型的计算成本和提高运行效率，使其能够在资源受限的环境中使用，例如移动设备或边缘计算设备。
多任务学习和持续学习：
- 研究UniST在多任务学习设置下的性能，以及如何通过持续学习来适应新的数据分布和预测任务。
模型鲁棒性和健壮性：
- 研究模型在面对数据噪声、缺失数据和异常值时的鲁棒性，并探索提高模型健壮性的方法。
实际部署和应用：
- 将UniST应用于实际的城市管理系统，评估其在真实世界中的性能，并探索与现有城市基础设施的集成方法。

这些方向不仅有助于推动城市时空预测领域的研究进展，还可能为城市规划、交通管理和资源优化等实际应用带来新的解决方案。

Q: 总结一下论文的主要内容

A: 这篇论文的主要内容可以总结如下：

问题定义：论文针对城市时空预测问题，提出了一种通用模型UniST，旨在解决现有方法在泛化能力和适应性方面的不足。
模型设计：UniST模型采用了基于Transformer的编码器-解码器架构，并通过时空标记器（Spatio-Temporal Tokenizers）处理多维时空数据。模型包括两个阶段：大规模时空预训练和时空知识引导的提示微调。
预训练策略：UniST使用多种掩码策略进行自监督预训练，以捕捉复杂的时空关系，包括随机掩码、管道掩码、块掩码和时间掩码。
提示微调：引入了一种创新的提示机制，利用时空知识引导提示的生成，以适应不同的时空数据分布和预测任务。
实验验证：在多个城市和领域的15个数据集上进行了广泛的实验，包括短期和长期预测、小样本和零样本预测，证明了UniST在各种预测任务上的优越性能。
消融研究和分析：通过消融研究评估了模型中不同组件的贡献，并深入分析了提示学习器的行为和模型的可扩展性。
未来方向：论文讨论了模型的局限性和未来可能的研究方向，包括整合多种时空数据格式、提高模型的解释性、鲁棒性和实际应用部署。

总体而言，UniST模型通过结合大型语言模型的关键特性，提出了一种新的范式，用于城市时空预测，展示了在多个城市和领域中的强大泛化能力和适应性。