AI论文速读 | 【综述】城市计算中跨域数据融合的深度学习:分类、进展和展望

题目:Deep Learning for Cross-Domain Data Fusion in Urban Computing: Taxonomy, Advances, and Outlook

作者:Xingchen Zou, Yibo Yan, Xixuan Hao, Yuehong Hu, Haomin Wen(温皓珉), Erdong Liu, Junbo Zhang(张钧波), Yong Li(李勇), Tianrui Li(李天瑞), Yu Zheng(郑宇), Yuxuan Liang(梁宇轩)

机构:香港科技大学(广州),京东科技&京东智能城市,清华大学,西南交通大学

关键词:城市计算,数据融合,多模态数据,大语言模型,可持续发展

网址:https://arxiv.org/abs/2402.19348

项目地址:https://github.com/yoshall/Awesome-Multimodal-Urban-Computing

Cool Paper:https://papers.cool/arxiv/2402.19348

`标题与作者
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

摘要:

随着城市的不断发展,城市计算通过利用不同来源(例如地理、交通、社交媒体和环境数据)和模态(例如时空数据,视觉和文本模态)的跨域数据融合的力量,成为可持续发展的关键学科。 最近,看到利用各种深度学习方法促进智慧城市跨域数据融合的上升趋势。 为此,提出了第一篇综述——系统地回顾了为城市计算量身定制的基于深度学习的数据融合方法的最新进展。 具体来说,首先深入研究数据视角,以理解每种模式和数据源的作用。 其次,将该方法分为四个主要类别:基于特征、基于对齐、基于对比和基于生成的融合方法。 第三,将多模态城市应用进一步分为城市规划、交通、经济、公共安全、社会、环境和能源七类。 与之前的综述相比,本文更关注深度学习方法与城市计算应用的协同作用。 此外,还阐明了大型语言模型(LLM)和城市计算之间的相互作用,提出了可能彻底改变该领域的未来研究方向。 作者们坚信(firmly believe),综述中所描述的分类、进展和前景将极大地丰富研究界。

跨域城市计算蓝图。 左:通过数据融合过程整合来自不同模式的城市数据,包括时空、视觉、文本和其他模态。 右图:城市数据的多种来源,例如地理数据、交通、社交媒体、人口和环境。

本篇综述的动机:深度学习带来的范式转变使得之前关于城市数据融合的综述,有些过时了,因为传统的分类法可能无法恰当地捕捉这些先进方法之间的细微差别和差异。 鉴于这个问题,该综述致力于弥补这一差距,并通过提供符合深度学习时代的全面且更新的分类法来提供当代视角。

Q: 这篇论文试图解决什么问题?

A: 这篇论文旨在系统地回顾和分类针对城市计算的跨域数据融合方法,特别是在深度学习领域的最新进展。城市计算是一个多学科领域,它利用来自不同来源(如地理、交通、社交媒体和环境数据)的跨域数据融合来支持城市的可持续发展。随着城市化进程的加快,城市计算在解决能源消耗、环境污染、社会经济差异和交通问题等全球性挑战中发挥着越来越重要的作用。

论文的主要贡献和解决的问题包括:

  1. 数据视角:深入理解每种数据模态(如时空、视觉、文本等)和数据源(如传感器、卫星、社交媒体和公民生成数据)在城市计算中的作用。
  2. 方法分类:将城市计算中的跨域数据融合方法分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。
  3. 应用分类:将多模态城市应用分为七类:城市规划、交通、经济、公共安全、社会、环境和能源。
  4. 深度学习与城市计算的结合:探讨深度学习方法与城市计算应用的结合,特别是大型语言模型(LLMs)在城市计算中的应用前景。
  5. 未来研究方向:提出未来研究的方向,包括数据隐私保护、开放基准的建立、应用多样化以及效率优化等。
  6. 资源和实践应用:提供资源和实践应用的详细说明,帮助研究人员和利益相关者更好地理解城市数据模态的复杂性,并通过深度学习方法进行有效的数据融合。

通过这些贡献,论文旨在为城市计算领域的研究人员提供一个全面的资源,促进该领域的发展,并为解决城市化带来的挑战提供新的视角和工具。

Q: 有哪些相关研究?

相关综述与本文的比较(3方面:重点关注范围,相关模态和主要关注的主题)

A: 论文中提到了多个与城市计算和跨域数据融合相关的研究工作。以下是一些关键的相关研究:

  1. Zheng et al. (2015): 提供了跨域大数据融合方法的全面综述,特别是在城市计算领域。这项工作强调了跨域数据融合在整合多个信息源方面的关键作用。
  2. Wang et al. (2020): 对深度学习在时空数据挖掘中的应用进行了详尽的回顾,特别关注了多源时空数据的融合。
  3. Liu et al. (2020): 提供了城市大数据融合方法的总结,这些方法在2020年之前被广泛研究。
  4. Xie et al. (2020): 研究了基于生成对抗网络(GAN)的时空数据融合模型,特别是在人群流动预测方面。
  5. Yuan and Li (2021): 在智能交通领域,探讨了深度学习在城市计算中的应用。
  6. Afyouni et al. (2022): 研究了在社会事件检测中的应用,这是城市计算的一个子领域。
  7. Gao et al. (2022): 总结了基于生成对抗网络的融合模型,特别是在时空数据方面。
  8. Deldari et al. (2022): 集中在多模态数据融合的自监督表示学习上,这是一般领域的研究。
  9. Gao et al. (2023): 提出了一种基于Transformer的模型,用于交通需求预测,结合了多视图信息。
  10. Wang et al. (2023): 提出了一种基于扩散模型的街道视图图像生成方法,用于城市计算。
  11. Zhang et al. (2023): 提出了一种基于LLM的城市区域嵌入方法,用于城市计算。

这些研究为城市计算领域的数据融合提供了不同的视角和方法,涵盖了从基础理论到实际应用的广泛范围。论文通过这些相关工作,展示了城市计算领域在深度学习和数据融合方面的最新进展,并指出了未来研究的潜在方向。

Q: 论文如何解决这个问题?

A: 论文通过以下几个关键步骤来解决城市计算中跨域数据融合的问题:

  1. 系统分类:首先,论文提出了一个新颖的分类法,将现有的城市数据源分为五种类型(地理数据、交通数据、社交媒体数据、人口统计数据和环境数据),并从模态的角度(时空数据、视觉数据、文本数据等)对数据进行分类。这种分类有助于系统地理解和分析城市计算研究中使用的不同数据类型。
  2. 融合方法综述:论文详细回顾了城市计算中使用的融合方法,并将它们分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。每一类方法都有详细的技术描述和实例分析。
  3. 应用场景分析:论文进一步将城市应用分为七个领域:城市规划、交通、经济、公共安全、社会、环境和能源。对于每个领域,论文探讨了数据融合方法如何支持特定的下游任务。
  4. 数据集编译:为了支持研究和实践,论文全面编译了城市计算中常用的数据集,考虑了它们的来源、时间覆盖范围和空间分布特征。
  5. 未来研究方向:论文提出了未来研究的潜在方向,包括数据隐私保护、开放基准的建立、应用多样化以及效率优化等。这些方向旨在解决当前城市计算领域面临的挑战,并推动该领域的发展。
  6. LLMs与城市计算的结合:论文探讨了大型语言模型(LLMs)在城市计算中的应用,特别是在处理多模态和多源数据方面。LLMs的引入为城市计算提供了新的视角和工具。
  7. 资源和实践应用:论文提供了一个全面的资源列表,包括最新的论文列表和相关的开源数据集,以帮助研究人员和实践者更好地理解和应用深度学习技术进行城市数据融合。

通过这些步骤,论文不仅为城市计算领域的研究人员提供了一个全面的资源,而且为解决城市化带来的挑战提供了新的视角和工具。

综述中的城市计算中基于深度学习的跨域数据融合的分类框架。 该框架自下而上围绕三个维度构建:数据、融合方法和应用。 在每个视角中,将现有研究分为不同类别,以提供全面且组织良好的回顾。

Q: 论文做了哪些实验?

A: 在这篇论文中,作者并没有进行实验来验证某个特定的模型或算法,而是进行了一项全面的文献综述。这项综述旨在系统地回顾和分类针对城市计算的跨域数据融合方法,特别是在深度学习领域的最新进展。因此,论文的重点在于理论分析、方法论的分类和未来研究方向的提出,而不是实验验证。

论文的主要贡献包括:

  1. 数据视角的分析:对城市计算中使用的不同类型的数据源和模态进行了分类和讨论。
  2. 融合方法的分类:将现有的数据融合方法分为四类,并提供了每种方法的详细描述和应用实例。
  3. 应用领域的分类:将城市计算的应用分为七个主要领域,并探讨了深度学习在这些领域中的应用。
  4. 数据集的编译:提供了一个关于城市计算中常用数据集的全面列表,包括它们的来源、时间覆盖范围和空间分布特征。
  5. 未来研究方向的提出:基于当前研究的局限性和挑战,提出了未来研究的潜在方向。
  6. LLMs与城市计算的结合:探讨了大型语言模型(LLMs)在城市计算中的应用前景。

由于这项工作的性质是文献综述,所以没有包含实验部分。相反,作者通过分析现有的研究工作来建立一个全面的理论框架,并为未来的实证研究提供指导。

数据视角的分析

地理数据,交通数据,社交网络数据,人口数据,环境数据及其它。

城市计算跨域数据融合范围内强相关论文中数据集类型的比例。

融合方法的分类

基于特征融合,基于对齐融合,基于对比融合和基于生成融合

城市计算基于深度学习跨域数据融合的方法分类

应用领域的分类

城市规划,经济,社交,能源,交通,公共安全以及环境

城市计算中跨域数据融合的应用(类别)和常见下游任务(子类别)的分类

数据集的编译

地理数据,交通数据,社交网络数据,人口数据和环境数据

在城市计算中用于跨域数据融合的开源数据集的分类和总结

城市计算中基于深度学习的跨域数据融合模型的总结。方法名称将基于原始引用模型名称进行分配;否则,它们将以第一作者的名字命名。

Q: 有什么可以进一步探索的点?

A: 论文提出了几个未来研究方向,这些方向为城市计算和跨域数据融合领域的研究提供了潜在的探索点:

  1. 大型语言模型(LLMs)的应用:探索LLMs在城市计算中的应用,特别是在处理多模态和多源数据方面。研究LLMs如何与城市数据融合相结合,以及它们在城市分析和预测中的潜在作用。
  2. 智能体模拟(Agent-based Simulation):开发基于LLM驱动的智能体模型,以模拟城市动态并提高城市系统的适应性和响应性。这可以帮助创建更加智能和响应性强的未来城市。
  3. 多模态因果学习:研究如何将因果推断技术应用于城市数据,以提高对城市系统复杂动态的解释能力。这包括开发新的算法和技术来理解和预测城市环境中的因果关系。
  4. 多源数据隐私保护:研究如何在保护个人隐私的同时利用多源数据进行城市计算。这涉及到开发新的隐私保护技术,如差分隐私和联邦学习。
  5. 开放基准(Open Benchmark):合作开发标准化的数据格式、统一的评估指标和共享基准,以便于跨域数据融合模型的评估和比较。
  6. 下游任务多样性:扩展城市研究的范围,涵盖更多领域的应用,如经济、社会和环境,以全面理解城市环境中的挑战。
  7. 计算效率:优化城市计算模型的计算效率,包括模型压缩、高效训练和高效架构设计,以提高模型在实际城市环境中的可行性和有效性。
  8. 跨域数据融合的挑战:解决跨域数据融合中的具体挑战,如数据异构性、数据质量、数据集成和模型泛化能力。

这些研究方向不仅有助于推动城市计算领域的科学进步,而且对于解决实际城市问题和提高城市生活质量具有重要意义。

Q: 总结一下论文的主要内容

A: 这篇论文提供了一个全面的综述,专注于城市计算领域中跨域数据融合的最新进展,特别是深度学习方法的应用。以下是论文的主要内容总结:

  1. 背景与动机:随着城市化进程的加快,城市计算成为了一个关键领域,它通过整合和分析来自不同来源(如地理、交通、社交媒体和环境数据)的跨域数据来支持城市的可持续发展。
  2. 数据视角:论文首先从数据的角度出发,探讨了城市计算中使用的不同数据模态(如时空、视觉、文本等)和数据源(如传感器、卫星、社交媒体等)的作用。
  3. 方法分类:提出了一个新颖的分类法,将城市计算中的跨域数据融合方法分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。
  4. 应用领域:将城市计算的应用分为七个主要领域,包括城市规划、交通、经济、公共安全、社会、环境和能源,并探讨了深度学习在这些领域的应用。
  5. 数据集编译:提供了一个关于城市计算中常用数据集的全面列表,包括它们的来源、时间覆盖范围和空间分布特征。
  6. 未来研究方向:指出了城市计算领域中的一些潜在研究方向,如LLMs的应用、智能体模拟、多模态因果学习、数据隐私保护、开放基准、下游任务多样性和计算效率。
  7. LLMs与城市计算:探讨了大型语言模型(LLMs)与城市计算的结合,以及它们在处理多模态和多源数据方面的潜力。
  8. 资源和实践应用:提供了一个资源列表,包括最新的论文列表和相关的开源数据集,以帮助研究人员和实践者更好地理解和应用深度学习技术进行城市数据融合。

总的来说,这篇论文为城市计算领域的研究人员提供了一个全面的资源,展示了深度学习在跨域数据融合中的应用,并为未来的研究提供了新的方向和视角。

项目概览

项目地址:https://github.com/yoshall/Awesome-Multimodal-Urban-Computing

项目目录:

  • 相关综述
  • 分类框架
  • 数据融合方法
  • 开源数据集的分类总结
  • 强相关的论文列表

项目内容

相关综述

按照时间顺序的相关综述

相关综述

分类框架

分类框架

数据融合方法

数据融合方法

数据融合方法分为4类:

  1. 基于特征(Feature Based Data Fusion
  2. 基于对齐(Alignment Based Data Fusion
  3. 基于对比(Contrast Based Data Fusion
  4. 基于生成(Generation Based Data Fusion

开源数据集的分类总结

开源数据集的分类总结

开源数据集的分类总结分为(分类,内容,形式):

  1. 地理数据(Geographical Data)
    1. 卫星图像(Satellite Image):图像
    2. 街道图像(Street View Image):图像
    3. POIs:点向量(Point Vector)
  2. 交通数据(Traffic Data)
    1. 交通轨迹(Traffic Trajectory):时空轨迹
    2. 交通流(Traffic Flow):时空图
    3. 路网(Road Network):时空图
    4. 物流(Logistics):时空轨迹
  3. 社交网络数据(Social Network)
    1. 文本(Text):文本
    2. 地理标记的图像和视频(Geo-tagged Image&Video):图像和视频
    3. 用户信息(Users’ Info):时间序列
  4. 人口统计数据(Demographic Data)
    1. 犯罪(Crime):时间序列
    2. 土地利用(Land Use):时间序列
    3. 人口(Population):时序
  5. 环境数据(Environmental Data)
    1. 气象(Meteorology):时间序列
    2. 绿化(Greenery):时间序列
    3. 空气质量(Air Quality):时间序列

强相关论文列表

按照国内外城市计算实验室总结

强相关的论文列表

国内外高校和企业里时空数据挖掘相关的团队有哪些?
环境数据(Environmental Data)

  1. 气象(Meteorology):时间序列
  2. 绿化(Greenery):时间序列
  3. 空气质量(Air Quality):时间序列

强相关论文列表

按照国内外城市计算实验室总结

[外链图片转存中…(img-CBkZy1XP-1709808431165)]

国内外高校和企业里时空数据挖掘相关的团队有哪些?
https://www.zhihu.com/question/617528629/answer/3177883285
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/728572.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

进程之舞:操作系统中的启动、状态转换与唤醒艺术

✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨ 🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua,在这里我会分享我的知识和经验。&#x…

解决QT cc1plus.exe: error: out of memory allocating

QT中增加资源文件过大时,会编译不过,报错: cc1plus.exe: out of memory allocating 1073745919 bytes 使用qrc资源文件,也就是在QT的工程中添加资源文件,就是添加的资源文件(如qrc.cpp)会直接被…

简明固体物理--晶体的形成与晶体结构的描述

简明固体物理-国防科技大学 chapter 1 Formation of Crystal Contents and roadmapQuantum Mechanics and atomic structureElectronsOld quantum theoryMethod of Quantum MechanicsDistributing functions of micro-particles BindingCrystal structure and typical crystal…

Go-Gin-example 第五部分 加入swagger

上一节链接 swagger 为什么要用swagger 问题起源于 前后端分离, 后端:后端控制层,服务层,数据访问层【后端团队】前端:前端控制层,视图层,【前端团队】 所以产生问题:前后端联调…

Keepalived+LVS构建高可用集群

目录 一、Keepalive基础介绍 1. Keepalive与VRRP 2. VRRP相关技术 3. 工作原理 4. 模块 5. 架构 6. 安装 7. Keepalived 相关文件 7.1 配置组成 7.2 全局配置 7.3 VRRP实例配置(lvs调度器) 7.4 虚拟服务器与真实服务器配置 二、Keepalived…

HTML静态网页成品作业(HTML+CSS)——花主题介绍网页设计制作(1个页面)

🎉不定期分享源码,关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 🏷️本套采用HTMLCSS,未使用Javacsript代码,共有1个页面。 二、作品演示 三、代…

C语言:基于单链表实现的泊车管理系统

一、需求 (1)管理员方账号登录; (2)车位管理显示:车位状态; (3)收费管理:小轿车 5元/小时,面包车6元/小时,大货车或客车7元/小时&a…

ChatGPT提示技巧——零,一和少量示例提示

ChatGPT提示技巧——零,一和少量示例提示 ​ 零样本(zero-shot)、少样本(few-shot)和单样本(one-shot)提示是用于在最少或没有示例的情况下从ChatGPT生成文本的技巧。这些技巧用于当某个具体任务有限定数据的时候或者任务是新的并且没有很好的定义的时候。 提示格…

设计模式之——简单工厂模式

上图为简单工厂模式的架构图。 1,产品(Product) 将会对接口进行声明。 2,具体产品(Concrete Products)是产品接口的不同实现。 3,创建者(Concrete Creators)将会重写基…

TCP传输收发

TCP通信: TCP发端: socket connect send recv close TCP收端: socket bind listen accept send recv close 1.connect int connect(int sockfd, const struct sockaddr *addr, socklen_t ad…

20个Python函数程序实例

前面介绍的函数太简单了: 以下是 20 个不同的 Python 函数实例 下面深入一点点: 以下是20个稍微深入一点的,使用Python语言定义并调用函数的示例程序: 20个函数实例 简单函数调用 def greet():print("Hello!")greet…

css-vxe-form-item中输入框加自定义按钮(校验位置错误)

1.浮动错误效果 提示内容不对 2.不使用浮动&#xff0c;使用行内块元素 代码如下 <vxe-form-item title"yoyo:" field"assembleWorkNo" span"8"><template #default><vxe-input style"width:70%;display:inline-block;&quo…

全天候购药系统(微信小程序+web后台管理)

PurchaseApplet 全天候购药系统&#xff08;微信小程序web后台管理&#xff09; 传统线下购药方式存在无法全天候向用户提供购药服务&#xff0c;无法随时提供诊疗服务等问题。为此&#xff0c;运用软件工程开发规范&#xff0c;充分调研建立需求模型&#xff0c;编写开发文档…

Java输入和输出处理

一、Java I/O 文件、内存、键盘--->程序--->文件、内存、控制台 二、文件 相关记录或放在一起的数据的集合 思考&#xff1a; Java程序如何访问文件属性&#xff1f; 解答&#xff1a; Java API:java.io.File类 三、File类 File类的常用方法 方法名称说明boole…

maven项目结构管理统一项目配置操作

一、maven分模块开发 Maven 分模块开发 1.先创建父工程&#xff0c;pom.xml文件中&#xff0c;打包方式为pom 2.然后里面有许多子工程 3.我要对父工程的maven对所有子工程进行操作 二、解读maven的结构 1.模块1 <groupId>org.TS</groupId><artifactId>TruthS…

黑马点评-分布式锁业务

分布式锁原理和实现 分布式系统部署了多个tomcat&#xff0c;每个tomcat都有一个属于自己的jvm&#xff0c;那么假设在服务器A的tomcat内部&#xff0c;有两个线程&#xff0c;这两个线程由于使用的是同一份代码&#xff0c;那么他们的锁对象是同一个&#xff0c;是可以实现互…

2024 PhpStorm激活,分享几个PhpStorm激活的方案

文章目录 PhpStorm 公司简介我这边使用PhpStorm的理由PhpStorm 2023.3 最新变化AI Assistant 预览阶段结束 正式版基于 LLM 的代码补全测试代码生成编辑器内代码生成控制台中基于 AI 的错误解释 Pest 更新PHP 8.3 支持#[\Override] 特性新的 json_validate() 函数类型化类常量弃…

142.环形链表II

142.环形链表II 力扣题目链接(opens new window) 题意&#xff1a; 给定一个链表&#xff0c;返回链表开始入环的第一个节点。 如果链表无环&#xff0c;则返回 null。 为了表示给定链表中的环&#xff0c;使用整数 pos 来表示链表尾连接到链表中的位置&#xff08;索引从 0…

Linux性能分析之CPU实战

本课程专注于教授学员如何利用各种工具和技术来分析Linux系统中的CPU性能问题。通过实际操作和案例研究&#xff0c;学员将深入了解CPU性能优化和故障排除&#xff0c;提升其在Linux环境下的技能水平。 课程大小&#xff1a;1.9G 课程下载&#xff1a;https://download.csdn.…

例行性工作(at,crontab)

目录 单一执行的例行性工作at 语法 选项 时间格式 at的工作文件存放目录 at工作的日志文件 实例 命令总结&#xff1a; 循环执行的例行性工作crond 语法 选项 crontab工作调度对应的系统服务 crontab工作的日志文件 用户定义计划任务的文件所在目录 动态查看 crontab文件格式 文…