AI论文速读 |2024[TPAMI]【综述】自监督学习在时间序列分析的分类、进展与展望

题目: Self-Supervised Learning for Time Series Analysis: Taxonomy, Progress, and Prospects

作者:Kexin Zhang, Qingsong Wen(文青松), Chaoli Zhang, Rongyao Cai, Ming Jin(金明), Yong Liu(刘勇), James Zhang, Yuxuan Liang(梁宇轩), Guansong Pang(庞观松), Dongjin Song(宋东进), Shirui Pan(潘世瑞)

机构:浙江大学,松鼠AI,浙江师范大学,莫纳什大学(Monash),蚂蚁集团,香港科技大学(广州),新加坡管理大学(SMU),康涅狄格大学(Connecticut),格里菲斯大学(Griffith)

arXiv网址https://arxiv.org/abs/2404.01340

IEEE网址https://ieeexplore.ieee.org/abstract/document/10496248/

Cool Paperhttps://papers.cool/arxiv/2404.01340

项目地址https://github.com/qingsongedu/Awesome-SSL4TS

关键词:自监督学习,时间序列分析。

TL, DR: 本文全面回顾了自监督学习(SSL)在时间序列分析中的最新进展,提出了一个包含生成式、对比式和对抗式三种主要方法的新分类体系,并对这些方法的关键思想、主要框架、优缺点进行了深入分析。此外,文章还总结了在时间序列预测、分类、异常检测和聚类任务中常用的数据集,并探讨了时间序列SSL未来的研究方向。

该综述23年6月上线arXiv,24年4月初被接受,目前已经有32个引用。

🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

摘要

自监督学习(SSL)最近在各种时间序列任务上取得了令人印象深刻的表现。 SSL最突出的优点是减少了对标记数据的依赖。 基于预训练和微调策略,即使少量的标记数据也能实现高性能。 与许多已发表的关于计算机视觉和自然语言处理的自监督综述相比,仍然缺少针对时间序列 SSL 的全面综述。 为了填补这一空白,我们在本文中回顾了当前最先进的时间序列数据 SSL 方法。 为此,本文首先全面回顾与 SSL 和时间序列相关的现有综述,然后从基于生成、基于对比和基于对抗性三个角度进行总结,为现有时间序列 SSL 方法提供新的分类。 这些方法进一步分为十个子类别,并对它们的关键直觉、主要框架、优点和缺点进
行了详细的回顾和讨论。 为了方便时间序列 SSL 方法的实验和验证,还总结了时间序列预测、分类、异常检测和聚类任务中常用的数据集。 最后,提出了 SSL 时间序列分析的未来方向。

SSL4TS分类

Q: 这篇论文试图解决什么问题?

A: 这篇论文试图解决的问题是如何在时间序列数据分析中应用自监督学习(Self-Supervised Learning, SSL)以减少对标记数据的依赖。时间序列数据在许多实际场景中非常普遍,例如人类活动识别、工业故障诊断、智能建筑管理和医疗保健等。然而,获取大量标记数据往往是耗时且困难的。自监督学习通过使用预训练和微调策略,即使只有少量标记数据也能达到高性能,从而减少了对标记数据的依赖。

论文的主要贡献包括:

  1. 提出了一个新的分类法,将现有的时间序列SSL方法分为三类:基于生成的(Generative-based)、基于对比的(Contrastive-based)和基于对抗的(Adversarial-based)。
  2. 对每个子类别进行了详细回顾和讨论,包括它们的关键直觉、主要框架、优缺点。
  3. 总结了在时间序列预测、分类、异常检测和聚类任务中常用的数据集。
  4. 讨论了时间序列SSL的未来方向,包括数据增强的选择与组合、正负样本的选择、时间序列SSL的归纳偏差、理论分析、对抗性攻击和稳健性分析、时间序列领域适应、预训练和大型模型、协作系统中的时间序列SSL以及时间序列SSL的基准评估等。

通过这项工作,作者希望能够激发对时间序列SSL领域的进一步研究兴趣。

Q: 有哪些相关研究?

A: 这篇论文提到了与时间序列自监督学习(SSL)相关的多个研究领域和具体工作,可以概括如下:

  1. 自监督学习(SSL): 论文提到了在计算机视觉(CV)和自然语言处理(NLP)领域中SSL的成功应用,并探讨了将SSL扩展到时间序列数据的潜力和挑战。
  2. 时间序列分析: 论文讨论了时间序列数据的独特属性,如季节性、趋势和频域信息,并指出直接将为图像或语言数据设计的SSL技术应用到时间序列数据上通常不可行。
  3. 生成模型: 论文中提到了使用生成模型进行时间序列分析的方法,包括自回归模型、自编码器重建和扩散模型。
  4. 对比学习: 论文探讨了基于对比的学习策略,包括通过数据增强或上下文采样生成正负样本的方法。
  5. 对抗生成网络(GANs): 论文中提到了使用GANs进行时间序列数据的生成和插补,以及作为辅助表示增强的策略。
  6. 时间序列数据集: 论文总结了在时间序列预测、分类、异常检测和聚类任务中常用的数据集。
  7. 时间序列SSL的未来方向: 论文提出了多个未来研究方向,包括数据增强的选择与组合、正负样本的选择、时间序列SSL的归纳偏差、理论分析、对抗性攻击和稳健性分析、时间序列领域适应、预训练和大型模型、协作系统中的时间序列SSL以及时间序列SSL的基准评估等。

具体到文献,论文中引用了大量的相关工作,包括但不限于以下几篇:

  • [17] A. Jaiswal, A. R. Babu, M. Z. Zadeh, D. Banerjee, and F. Makedon, “A survey on contrastive self-supervised learning,” Technologies, vol. 9, no. 1, 2021.
  • [18] L. Jing and Y. Tian, “Self-supervised visual feature learning with deep neural networks: A survey,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 43, no. 11, pp. 4037–4058, 2021.
  • [19] E. Eldele, M. Ragab, Z. Chen, M. Wu, C.-K. Kwoh, and X. Li, “Label-efficient time series representation learning: A review,” 2023.
  • [20] S. Deldari, H. Xue, A. Saeed, J. He, D. V. Smith, and F. D. Salim, “Beyond just vision: A review on self-supervised representation learning on multimodal and temporal data,” CoRR, vol. abs/2206.02353, 2022.

这些相关工作为论文提供了理论基础和方法论支持,并且论文在这些研究的基础上进行了扩展和深化,特别是在时间序列数据的自监督学习方面。

SSL不同模态综述

Q: 论文如何解决这个问题?

A: 论文通过以下几个步骤来解决时间序列数据分析中的自监督学习问题:

  1. 新分类法提出:论文首先提出了一个新的分类法,将现有的时间序列自监督学习(SSL)方法分为三个主要类别:基于生成的(Generative-based)、基于对比的(Contrastive-based)和基于对抗的(Adversarial-based)。这种分类有助于系统地理解和比较不同的SSL方法。
  2. 详细回顾和讨论:对于每个SSL子类别,论文详细回顾了相关方法,并讨论了它们的关键直觉、主要框架、优势和劣势。这为选择合适的SSL方法提供了理论基础和实践指导。
  3. 数据集总结:论文总结了在时间序列预测、分类、异常检测和聚类任务中常用的数据集。这有助于研究者在实验和验证SSL方法时有一个共同的基准。
  4. 未来方向探讨:论文讨论了时间序列SSL的未来研究方向,包括数据增强的选择与组合、正负样本的选择、时间序列SSL的归纳偏差、理论分析、对抗性攻击和稳健性分析、时间序列领域适应、预训练和大型模型、协作系统中的时间序列SSL以及时间序列SSL的基准评估等。这些方向为未来的研究提供了可能的探索路径。
  5. 实验和验证:虽然论文没有提供具体的实验结果,但它为如何进行实验和验证SSL方法提供了指导。研究者可以根据论文中的分类和讨论设计实验,验证不同SSL方法在时间序列数据上的有效性。

通过这些步骤,论文旨在为时间序列数据分析中的自监督学习提供一个全面的框架,并推动该领域的研究进展。

3种生成式自监督

  1. 自回归预测(Autoregressive-based forecasting):使用过去的时间序列数据来预测未来的值。
  2. 自编码器重建(Autoencoder-based reconstruction):通过编码器和解码器重建输入的时间序列数据。
  3. 扩散生成(Diffusion-based generation):使用逐步添加噪声的过程来生成新的数据样本。

5种对比式自监督

  1. 采样对比(Sampling contrast):通过随机采样来构建正负样本对。
  2. 预测对比(Prediction contrast):使用预测任务来构建正负样本对。
  3. 增强对比(Augmentation contrast):通过数据增强技术来生成不同的数据视图。
  4. 原型对比(Prototype contrast):使用原型(如聚类中心)来构建样本对。
  5. 专家知识对比(Expert knowledge contrast):利用领域知识来指导样本对的构建。

3种对抗式自监督

  1. 时间序列生成和插补(Time series generation and imputation):使用GANs生成新的时间序列或填补缺失值。
  2. 辅助表示增强(Auxiliary representation enhancement):将对抗信号作为正则化项,以提高模型的稳健性。

Q: 论文做了哪些实验?

A: 论文本身并没有进行特定的实验来验证提出的分类法或方法,而是提供了一个全面的文献回顾和分析。具体来说,论文的主要贡献集中在以下几个方面:

  1. 提出新的分类法:论文提出了一个新的分类法,将时间序列自监督学习方法分为生成基(Generative-based)、对比基(Contrastive-based)和对抗基(Adversarial-based)三个主要类别,并进一步细分为十个子类别。
  2. 详细回顾和讨论:对于每个子类别,论文详细回顾了相关的方法,并讨论了它们的关键直觉、主要框架、优势和劣势。
  3. 数据集总结:论文总结了在时间序列预测、分类、异常检测和聚类任务中常用的数据集,为实验和验证SSL方法提供了基准。
  4. 未来方向的讨论:论文讨论了时间序列SSL的未来研究方向,为未来的研究提供了可能的探索路径。

尽管论文没有进行实验验证,但它为如何进行实验和验证SSL方法提供了指导。研究者可以根据论文中的分类和讨论设计实验,验证不同SSL方法在时间序列数据上的有效性。此外,论文中引用了大量的相关工作,这些工作可能包含了使用类似方法的实验结果和验证。

如果需要查看具体的实验结果和验证,可以参考论文中引用的相关文献,这些文献可能提供了具体的实验设置、结果和分析。

时序数据集

Q: 有什么可以进一步探索的点?

A: 论文提出了时间序列自监督学习(SSL)的多个未来研究方向,可以进一步探索的点包括:

  1. 数据增强的选择与组合:探索不同的数据增强方法对时间序列SSL性能的影响,并研究如何选择或组合这些方法以获得最佳效果。
  2. 正负样本的选择:研究如何更准确地选择正负样本对,以提高对比学习等SSL方法的性能。
  3. 时间序列SSL的归纳偏差:分析时间序列数据的特性,探索如何引入归纳偏差来指导模型学习,从而提高SSL的效果。
  4. 理论分析:对SSL方法进行理论分析,包括理解其学习机制、优化目标和表示能力等。
  5. 对抗性攻击和稳健性分析:研究时间序列模型在对抗性攻击下的脆弱性,并探索提高模型稳健性的策略。
  6. 时间序列领域适应:探索如何将在一个领域预训练的模型有效地迁移到另一个领域,以及如何利用领域知识来提高SSL的性能。
  7. 预训练和大型模型:研究预训练模型在大规模时间序列数据集上的表现,以及如何利用大型模型来提高SSL的性能。
  8. 协作系统中的时间序列SSL:探索在分布式系统或协作系统中部署时间序列SSL的方法,以及如何保护用户隐私。
  9. 时间序列SSL的基准评估:建立和完善时间序列SSL的评估基准,包括标准化的数据集、评估协议和比较分析。
  10. 混合SSL策略:研究如何结合多种SSL策略来提高时间序列分析的性能。

这些方向不仅涉及方法论的改进,也包括对现有理论的深化和新应用领域的探索。研究者可以根据具体的研究兴趣和实际问题选择适合的研究方向进行深入探索。

Q: 总结一下论文的主要内容

A: 这篇论文的主要内容可以总结如下:

  1. 背景与动机:论文讨论了自监督学习(SSL)在时间序列分析中的重要性,特别是在减少对标记数据依赖方面的优势。时间序列数据在多个领域中普遍存在,但获取标记数据往往是困难和耗时的。
  2. 新分类法:论文提出了一个新的分类法,将时间序列SSL方法分为三个主要类别:基于生成的(Generative-based)、基于对比的(Contrastive-based)和基于对抗的(Adversarial-based)方法,并进一步细分为十个子类别。
  3. 详细回顾:对于每个SSL子类别,论文提供了详细的回顾和讨论,包括它们的关键直觉、主要框架、优势和劣势。
  4. 数据集总结:论文总结了在时间序列预测、分类、异常检测和聚类任务中常用的数据集,为实验和验证SSL方法提供了基准。
  5. 未来方向:论文讨论了时间序列SSL的未来研究方向,包括数据增强的选择与组合、正负样本的选择、时间序列SSL的归纳偏差、理论分析、对抗性攻击和稳健性分析、时间序列领域适应、预训练和大型模型、协作系统中的时间序列SSL以及时间序列SSL的基准评估等。
  6. 贡献:论文的主要贡献在于提供了一个全面的时间序列SSL方法的分类和回顾,以及对未来研究方向的展望,旨在推动该领域的研究进展。

论文没有进行特定的实验验证,但通过广泛的文献回顾和分析,为时间序列数据分析中的自监督学习提供了一个结构化的视角,并为未来的研究工作指明了方向。

附录

本文的附录有很多关于自监督学习的讨论值得一看

根据您提供的论文内容,本文的附录(Appendix)部分包含了以下内容:

A. 自监督学习范式

介绍了生成式(Generative-based)、对比式(Contrastive-based)和对抗式(Adversarial-based)三种自监督学习(SSL)方法的模型架构。

SSL范式

B. SSL四个主要流程的进一步描述和总结

对SSL的四个主要流程:正负样本的构建、预文本任务的进一步分类、SSL模型架构的特点、以及SSL损失函数的目标进行了详细描述和总结。

前置任务分类

C. 3种生成式的优缺点

对生成式方法中的三种子方法(自回归预测、自编码器重建和扩散生成)的优点和缺点进行了总结。

生成式的优缺点

D. RNN, CNN和GNN的优缺点

对时间序列分析中常用的三种神经网络模型(循环神经网络RNN、卷积神经网络CNN和图神经网络GNN)的优点和缺点进行了讨论。

E. 5种对比式的优缺点

对对比式方法中的五种子方法(采样对比、预测对比、增强对比、原型对比和专家知识对比)的优点和缺点进行了总结。

F. 2种对抗式的优缺点

对对抗式方法中的两种子方法(时间序列生成和插补、辅助表示增强)的优点和缺点进行了总结。

G. 3种SSL方法的特点和局限性

总结了三种SSL方法(生成式、对比式和对抗式)的特点和局限性。

3种SSL范式的优缺点

H. 任务流程,评价指标和示例

描述了异常检测、预测、分类和聚类任务的评估指标、示例和任务流程。

SSL4TS的任务流程

I. 不同方法的定量比较

对不同方法的性能进行了定量比较,并分析了方法与任务之间的相关性。

异常检测定量比较预测量化结果

标、示例和任务流程。

[外链图片转存中…(img-Yzb1abKH-1713851408832)]

I. 不同方法的定量比较

对不同方法的性能进行了定量比较,并分析了方法与任务之间的相关性。

[外链图片转存中…(img-7HY8pU7j-1713851408832)][外链图片转存中…(img-NaFnCewA-1713851408832)]

分类和聚类定量比较
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/2154.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Zabbix监控系统:基础配置及部署代理服务器

目录 前言 一、自定义监控内容 1、在客户端创建自定义key 2、在服务端验证新建的监控项 3、在web界面创建自定义监控项模版 3.1 创建模版 3.2 创建应用集(用于管理监控项) 3.3 创建监控项 3.4 创建触发器 3.5 创建图形 3.6 将主机与模板关联…

基于Springboot+Vue的高校就业信息管理系统的设计与实现

1、系统演示视频(演示视频) 2、需要请联系

Linux系统中Nginx的使用

Nginx是一款开源的高性能、高可靠性的Web服务器和反向代理服务器。它在Linux系统中得到了广泛的应用,被用于构建高性能的Web应用和提供反向代理服务。下面将介绍Nginx在Linux系统中的使用以及一些常见的应用案例。 一、Nginx的安装和配置 安装Nginx 在Linux系统中…

Parallels Desktop 19完美中文版 PD19虚拟机详细图文安装教程 亲测兼容M1/M2

对于许多Mac用户来说,运行Windows应用程序是必不可少的。也许你的雇主使用的软件只适用于Windows,或者需要使用依赖于某些Windows技术的网站。或者你想在Mac上玩Windows游戏。或者,你可能需要在其他操作系统上测试应用程序和服务——你可以在…

免 Administrator 权限安装软件

以欧路词典为例, 从官网下载的安装包 https://www.eudic.net/v4/en/app/download 直接运行会弹出 UAC 提示需要管理员权限. 一个词典而已, 为啥要管理员权限呢? 答案是安装程序默认使用的安装路径是 C:\Program Files\ 这就不难理解了. 对于这种不需要其他额外权限的软件, 可以…

陪甲方吃饭3万不眨眼,升级自己B端界面花3000,感觉肉疼。

这种情况其实贝格前端工场是经常碰到的,不仅在我们这个行业,在所有行业都存在,这种现象也好解释,中间原因,贝格给大家解读一下。 中国是个人情和熟人社会,做生意讲求托关系,找熟人,…

HSB矩形调色板设计和计算方法

HSB矩形调色板设计和计算方法 RGB调色板绘制较容易,HSB调色板较难绘制,前些天发文介绍了几个矩形样例的绘制方法,今介绍矩形的HSB调色板的设计方法和H,S,B值的计算方法,好东西必须与大家分享。 此文介绍HSB调色板和选色条的绘制方…

Topaz Photo AI 3.0.0 (macOS Universal) - AI 图片修复工具

Topaz Photo AI 3.0.0 (macOS Universal) - AI 图片修复工具 Maximize Image Quality with AI 请访问原文链接:Topaz Photo AI 3.0.0 (macOS Universal) - AI 图片修复工具,查看最新版。原创作品,转载请保留出处。 作者主页:sy…

【黑马头条】-day12项目部署和发布-jenkins

文章目录 1 持续集成2 软件开发模式2.1 瀑布模式2.2 敏捷开发2.2.1 迭代开发2.2.2 增量开发 3 Jenkins3.1 Jenkins安装3.1.1 导入镜像3.1.2 配置3.1.3 初始化设置 3.2 插件安装3.3 服务器环境准备3.3.1 Docker安装配置3.3.2 Git安装配置3.3.3 Maven安装配置 3.4 Jenkins工具配置…

如何在PostgreSQL中对表进行重命名或修改表结构,以及这可能带来的潜在风险和解决方案

文章目录 一、对表进行重命名潜在风险及解决方案 二、修改表结构潜在风险及解决方案 PostgreSQL是一个强大的开源关系型数据库管理系统,它提供了丰富的SQL命令来管理数据库、表、视图等对象。其中,重命名表或修改表结构是常见的操作。但是,这…

在matplotlib中控制colorbar的长度

在matplotlib中控制colorbar的长度 使用matplotlib绘制带颜色的箭头图,有时想直接把颜色条拿来当比例尺条,就需要控制颜色条的长度。 1. pyplot.colorbar()参数说明 pyplot.colorbar(mappable, ax, cax, **kwargs) mappable是一个ScalarMappble类型的…

【精简改造版】大型多人在线游戏BrowserQuest服务器Golang框架解析(2)——服务端架构

1.架构选型 B/S架构:支持PC、平板、手机等多个平台 2.技术选型 (1)客户端web技术: HTML5 Canvas:支持基于2D平铺的图形引擎 Web workers:允许在不减慢主页UI的情况下初始化大型世界地图。 localStorag…

同旺科技 USB TO SPI / I2C适配器读写24LC256--字节写

所需设备: 1、USB 转 SPI I2C 适配器;内附链接 2、24LC256芯片 适应于同旺科技 USB TO SPI / I2C适配器升级版、专业版; 00地址写入一个字节数据AA,并读回验证; 单字节写时序: 读字节时序: …

MTK6775/MT6775/曦力P70联发科处理器性能参数资料

联发科MT6775(曦力P70)芯片搭载强大的Arm Cortex-A73/A53八核CPU,并采用台积电12纳米FinFET制程工艺,相较于其他14纳米级别产品,功耗节省达到了15%。此外,曦力P70还配备了高效能的Arm Mali-G72 GPU,相比上一代产品曦力…

C++ | Leetcode C++题解之第43题字符串相乘

题目&#xff1a; 题解&#xff1a; class Solution { public:string multiply(string num1, string num2) {if (num1 "0" || num2 "0") {return "0";}int m num1.size(), n num2.size();auto ansArr vector<int>(m n);for (int i …

算法——BFS算法

1. 什么是BFS算法 BFS&#xff08;广度优先搜索&#xff0c;Breadth-First Search&#xff09;算法是一种用于图和树等数据结构中进行搜索的基本算法。它从指定的起始节点开始&#xff0c;逐层地向外扩展搜索&#xff0c;直到找到目标节点或遍历完整个图。 BFS算法的基本思想是…

idea连接远程服务器并同步代码

idea连接远程服务器并同步代码 打开我们的idea。 tool -> deployment -> configuration 新建连接 -> sftp host输入你的远程服务器ip&#xff0c;输入用户名、密码、测试连接 连接成功 选择服务器根目录 web链接&#xff08;无需要不用&#xff09; 点击mappin…

【学习笔记二十一】EWM仓库两步拣配配置及操作展示

一、EWM两步拣配配置 1.定义两步拣配的WPT ①第一步:标准WPT2020,目标仓位是2010两步拣配的仓位,并创建存储类型2010的两步拣配的仓位 ②第二步,标准WPT2010,目标仓位9020发货区和发货的仓位 2.定义确定仓库处理类型的控制标识 3.确定仓库处理类型 4.仓库编码级别需要允…

Qt 集成OSG

Qt 你好 | 专注于Qt的技术分享平台 一&#xff0c;新建一个 QOsgWidget 类&#xff0c;继承自osgQOpenGLWidget #ifndef QOSGWIDGET_H #define QOSGWIDGET_H#include <QObject> #include <osgViewer/Viewer> #include <osgQOpenGL/osgQOpenGLWidget> class…

【ES】springboot集成ES

1. 去Spring官方文档确认版本兼容性 这一版的文档里没有给出springboot的版本对应&#xff0c;但我在一个博主的文章里看到的es8.0以前的官方文档中就有给出来&#xff0c;所以还需要再去寻找spring framework和springboot的对应关系&#xff1f;&#xff1f;&#xff1f; 还…