综述 | 走向图对比学习:综述与展望

【摘要】近年来,图的深度学习在各个领域取得了显著的成功。然而,对带注释的图形数据的依赖仍然是一个很大的瓶颈,因为它的成本过高且耗费时间。为了应对这一挑战,图的自监督学习(SSL)得到了越来越多的关注,并取得了重大进展。SSL使机器学习模型能够从未标记的图形数据中产生信息表示,从而减少对昂贵的标记数据的依赖。虽然基于图的SSL已被广泛采用,但一个关键组件——图对比学习(GCL)在现有文献中尚未得到彻底研究。因此,本调查旨在通过提供一个关于GCL的专门调查来填补这一空白。我们提供了GCL的基本原则,包括数据增强策略,对比模式和对比优化目标的全面概述。此外,我们探索了GCL对数据高效图学习的其他方面的扩展,如弱监督学习、迁移学习和相关场景。我们还讨论了跨领域的实际应用,如药物发现,基因组学分析,推荐系统,最后概述了这一领域的挑战和潜在的未来方向。

原文:Towards Graph Contrastive Learning: A Survey and Beyond
地址:https://arxiv.org/abs/2405.11868v1
代码:未知
出版:J. ACM
机构: Peking University, University of International Business and Economics

1 研究问题

本文研究的核心问题是: 如何全面综述图对比学习领域的最新进展,并探讨其在相关应用场景下的扩展。

假设一家金融公司希望根据客户的交易网络来预测客户的信用风险。传统方法需要大量的人工标注数据来训练图神经网络模型,成本很高。如果能利用图对比学习从未标注的交易网络中自监督地学习到信息丰富的节点表征,就可以大大减少对标注数据的依赖,提高模型的泛化能力。但目前缺乏一个全面的综述来梳理图对比学习的各种技术路线及其优劣。

本文研究问题的特点和现有方法面临的挑战主要体现在以下几个方面:

  • 图对比学习涉及的技术要素众多,包括数据增强策略、对比模式、优化目标函数等,缺乏系统性的总结。

  • 图对比学习在弱监督、迁移学习等数据高效场景下的应用尚不成熟,有待进一步探索。

  • 已有的综述性文章大多泛泛而谈,未能聚焦图对比学习领域,缺乏深度和前沿性。

针对这些挑战,本文提出了一种系统全面且富有前瞻性的"GCL综述与拓展"思路:

本文首先从数据增强、对比模式、优化目标三个维度,对自监督图对比学习的基本原理进行了全景式梳理,并配以数学化的总结。这就像是为图对比学习搭建了一个"技术百科全书",方便研究者快速查阅和比较不同技术路线。

其次,本文将视野拓展到弱监督学习、迁移学习等数据高效场景,探讨了图对比学习在其中的应用模式,这就像是为图对比学习插上了"领域适配"的翅膀,大大拓宽了其应用范围。

再次,本文列举了图对比学习在药物发现、生物信息、推荐系统等诸多领域的实际应用案例,使得这一理论工作"落地生根"。这就像是用一系列"应用明星"来印证图对比学习的实用价值。

最后,本文对图对比学习的局限性进行了反思,并展望了一些有待进一步探索的研究方向,这就像是在俯瞰全局后,为后续研究指明了"攻坚"的突破口。

2 研究方法

图对比学习(Graph Contrastive Learning, GCL)是一种自监督表示学习范式,通过最大化相似图对之间的一致性,提取图数据的有效表示。本节将从三个方面阐述GCL在自监督学习中的基本原理,并介绍其在弱监督学习、迁移学习等数据高效场景下的应用。

2.1 GCL在自监督学习中的基本原理

2.1.1 图数据增强策略

图数据增强旨在为给定图生成语义一致的正样本,以供对比学习使用。图增强策略可分为基于规则和基于学习两大类。

基于规则的方法通过预定义规则修改图数据。简单的策略包括随机扰动/遮蔽节点/边及其特征,如DropEdge随机移除一定比例的边:

其中为扰动率。另一种常见策略是随机采样子图,保留节点子集和对应边关系。复杂的方法如利用图扩散过程,基于热核、PPR等扩散核建立节点间高阶连接。

基于学习的方法通过数据驱动方式学习增强策略,如图结构学习、图对抗训练和图理由(rationale)发现。图结构学习将图结构视作可学习参数,识别最优的增强图。对抗训练旨在提升模型抵御对抗扰动的能力。图理由作为图的关键子集,可直接用于对比学习。

两类方法相比,基于规则的方法简单直观,但可能引入噪声;而基于学习的方法噪声更小,但训练开销大。实践中需权衡有效性和计算效率。

2.1.2 对比模式

GCL通过不同尺度图视图间的对齐,增强语义相似实例的一致性表示。按粒度从粗到细,视图可分为图级、子图级和节点级。据此,对比模式分为同尺度对比和跨尺度对比两类。

同尺度对比分为全局、上下文和局部三类。全局对比对齐不同图表示,如SimGRACE将原图与其扰动视图对比,无需显式数据增强。上下文对比聚焦子图粒度,如GCC对比同一节点和其他节点的k-hop子图。局部对比专注学习节点表示,如GRACE基于结构和属性视图,用对比损失函数增强节点表示的一致性:

其中为视图内/间负样本。

跨尺度对比包含局部-全局、局部-上下文和上下文-全局三类,分别关注不同粒度的对齐。以局部-全局为例,DGI利用互信息最大化准则,对比节点表示和图表示:

总的来说,同尺度对比简单直观,适合齐次图;跨尺度对比能建模多粒度语义,适合异质图。实践中可结合图类型和任务需求灵活选择。

2.1.3 对比优化目标

为优化GCL,需定义对比目标函数,度量正负样本间的相似性差异。常见方法分为对比式和非对比式两类。

对比式方法同时需要正负样本。基于InfoNCE的方法利用随机扰动生成增强视图,将同源节点视作正样本,其他节点为负样本。针对节点,InfoNCE损失定义为:

其中和分别为正负样本集,为相似度函数。基于散度的方法比较正负样本分布的差异,如JS散度。基于距离的方法如Triplet Margin直接比较正负样本间的相对距离。

非对比式方法不需显式构造负样本。基于知识蒸馏的方法如BGRL,通过在线和目标两个网络互相提升学习。基于冗余减少的方法如VICReg,联合方差、不变性和协方差最小化准则,对不同视图特征间的交叉相关矩阵进行冗余减少。

对比式方法需负样本数足够多时性能最佳,但构造负样本的计算开销大。非对比式方法省去了负样本构造,但理论基础有待加强。实践中需平衡性能和效率。

2.2 GCL在数据高效学习中的应用

除经典的自监督学习外,GCL在弱监督、迁移学习等数据高效场景下也有广泛应用。本节以弱监督图学习和图迁移学习为例展开介绍。

2.2.1 弱监督学习

图弱监督学习(Graph Weakly Supervised Learning, GWSL)利用标记和未标记数据,在低资源场景下提升模型性能。现有工作主要利用GCL完成两大功能:有效利用稀疏标签,充分挖掘无标签结构信息。

对于标签利用,一类方法利用已知类别对节点表示施加约束。如KGNN中,对比网络给出后验分布,而GNN给出似然,目标为最小化两者的KL散度:

另一类方法先基于节点特征计算标签中心,再以此作为软监督信号。如SimP-GCN基于KNN图构建软标签中心,指导对比学习。

对于结构集成,一类方法关注如何充分融合标签和结构的一致信息,通常将有监督损失和自监督对比损失相加联合优化:

DualGraph通过迭代标注和检索,识别并融合标签-结构一致信息。另一类方法关注如何缓解二者不一致带来的冲突。如 InfoGraph 先在不同尺度对齐节点-图结构,再与标签信息融合。

总的来说,GCL 为 GWSL 带来了新思路,有助于在标签稀疏时学到更鲁棒的节点表示。不同任务可灵活选择合适的标签利用和结构集成策略。

2.2.2 迁移学习

图迁移学习旨在源域数据和目标域数据分布不一致时,提升目标域上的推理性能。GCL 可从域间对齐/区分和域内特征提取两方面改善迁移学习效果。

域间方法通过源-目标域节点对比,挖掘域共性或特性。对齐型方法构造源域中的目标一致样本,或目标域中的源一致样本,再进行对比。如CoCo 生成目标域伪标签,基于此构造跨域正样本对:

区分型方法基于邻域相似度等构造正常-异常图样本,通过对比使

3 总结后记

本论文针对图表示学习中的图对比学习(GCL)方法进行了全面综述。文章系统总结了GCL的基本原理,包括数据增广策略、对比模式和优化目标等方面。并进一步探讨了GCL在弱监督学习、迁移学习等数据高效学习场景中的扩展应用。最后,讨论了GCL在药物发现、基因组学分析、推荐系统等实际领域的应用,展望了该领域面临的挑战和未来的发展方向。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/839246.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

群晖搭建网页版Linux Ubuntu系统并实现远程访问

文章目录 1. 下载Docker-Webtop镜像2. 运行Docker-Webtop镜像3. 本地访问网页版Linux系统4. 群晖NAS安装Cpolar工具5. 配置异地访问Linux系统6. 异地远程访问Linux系统7. 固定异地访问的公网地址 docker-webtop是一个基于Docker的Web桌面应用,它允许用户通过浏览器远…

二十五、openlayers官网示例CustomOverviewMap解析——实现鹰眼地图、预览窗口、小窗窗口地图、旋转控件

官网demo地址: Custom Overview Map 这个示例展示了如何在地图上增加一个小窗窗口的地图并跟随着地图的旋转而旋转视角。 首先加载了一个地图。其中 DragRotateAndZoom是一个交互事件,它可以实现按住shift键鼠标拖拽旋转地图。 const map new Map({int…

客户端Web资源缓存

为了提高Web服务器的性能,其中的一种可以提高Web服务器性能的方法就是采用缓存技术。 1.缓存 1.1.什么是缓存? 如果某个资源的计算耗时或耗资源,则执行一次并存储结果。当有人随后请求该资源时,返回存储的结果,而不是再次计算。…

【Linux】-Flink分布式内存计算集群部署[21]

注意: 本节的操作,需要前置准备好Hadoop生态集群,请先部署好Hadoop环境 简介 Flink同spark一样,是一款分布式内存计算引擎,可以支撑海量数据的分布式计算 Flink在大数据体系同样是明星产品,作为新一代的…

ElasticSearch集群重平衡(Shard allocation)案例分析及性能调优

何谓重平衡 ElasticSearch为了使数据平均分布在集群节点上,重平衡机制会由Master节点决定索引分片具体分配到哪个Data节点以及何时在节点之间迁移分片,使分片在数据大小、分片数量的层面上尽可能均匀分布在集群中的所有Data节点,充分发挥每个…

css - sass or scss ?

总的来说,Sass 和 SCSS 提供的功能是一样的,选择哪种语法主要取决于你的个人或团队的偏好。

4.2 循环语句(for, while)

💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…

【Linux取经路】基于信号量和环形队列的生产消费者模型

文章目录 一、POSIX 信号量二、POSIX 信号量的接口2.1 sem_init——初始化信号量2.2 sem_destroy——销毁信号量2.3 sem_wait——等待信号量2.4 sem_post——发布信号量 三、基于环形队列的生产消费者模型3.1 单生产单消费模型3.2 多生产多消费模型3.3 基于任务的多生产多消费模…

期货学习笔记-横盘行情学习1

横盘行情的特征及分类 横盘行情的概念 横盘行情时中继形态的一种,一般常出现在大涨或大跌之后出现横盘行情是对当前趋势行情的修正,是对市场零散筹码的清理,是为了集中筹码更便于后期行情的展开 横盘行情的特征 1.水平运动:该…

【文献阅读】ESG评级不确定性对企业绿色创新的影响研究

ESG评级不确定性对企业绿色创新的影响研究 张张张三丰de思考与感悟 论文内容总结:本文主要是关于ESG评级不确定性(也即来自三个评级机构的ESG得分差异),对企业绿色创新的影响。并且有效地区分了创新数量和创新质量。创新数量的是专…

iptablese防火墙【SNAT和DNAT】

目录 1.SNAT策略及应用 1.1SNAT原理与应用 1.2 SNAT策略的工作原理 1.3 实验操练 2.DNAT策略 2.1 DNAT策略的概述 2.2 DNAT原理与应用 2.3 实验操练 1.SNAT策略及应用 1.1SNAT原理与应用 SNAT 应用环境:局域网主机共享单个公网IP地址接入Internet&#xf…

uniappx 应用未读角标插件(完善推送、通知、消息效果) Ba-Shortcut-Badge-U

简介(下载地址) Ba-Shortcut-Badge-U 是设置应用未读角标的原生插件,UTS版本(同时支持uniapp和uniappx) 支持设置未读、清空未读支持机型有Huawei、oppo、xiaomi、Samsung、Sony、LG、HTC、ZUK、ASUS、ADW、APEX、NO…

快速将短信从 Android 传输到 iPhone [支持 iPhone 15]

短信中包含有关工作和生活的重要信息,因此当我们拿到新手机时,它们不会丢失。今天,我们要讨论的是如何将短信从Android快速传输到iPhone,包括最新的iPhone 15。在Android和iOS操作系统之间,我们可以轻松地将短信从Andr…

C语言(指针)8

Hi~!这里是奋斗的小羊,很荣幸各位能阅读我的文章,诚请评论指点,关注收藏,欢迎欢迎~~ 💥个人主页:小羊在奋斗 💥所属专栏:C语言 本系列文章为个人学习笔记&#x…

BUUCTF-misc23

[GUET-CTF2019]zips1 1.打开附件 是一个加密的压缩包 2.暴力破解压缩包 得到压缩包密码 3.010Editor 解密之后又得到一个加密的压缩包 发现不是解密文件 用010Editor打开是伪加密,将09 00 给为 00 00 4.Python 用Python运行文件里的部分内容,发现密…

高精度可编程直流电源功能

在电子产品开发和测试中,高精度可编程直流电源是一种非常重要的工具。它不仅能够提供稳定可靠的电源供应,还能够精确地控制输出电压和电流,满足各种复杂的测试需求。下面我们就来详细了解一下高精度可编程直流电源的功能特点。 1. 输出精度高 高精度可…

基于深度学习OCR文本识别

第一步:概要 基于深度学习OCR文本识别分为两个模块:DBNet和CRNN。 DBNet是基于分割的文本检测算法,算法将可微分二值化模块(Differentiable Binarization)引入了分割模型,使得模型能够通过自适应的阈值图进行二值化,并…

php发送短信功能(创蓝短信)

一、以下是创蓝发送短信的功能&#xff0c;可以直接执行&#xff1a; <?php$phone 12312312312;$msg 测试短信功能;echo 发送手机号&#xff1a;.$phone.<br/>;echo 发送内容&#xff1a;.$msg.<br/>;$send sendMessage($phone, $msg);var_dump($send);…

HQL面试题练习 —— 品牌营销活动天数

题目来源&#xff1a;小红书 目录 1 题目2 建表语句3 题解 1 题目 有营销活动记录表&#xff0c;记录了每个品牌每次营销活动的开始日期和营销活动的结束日期&#xff0c;现需要统计出每个品牌的总营销天数。 注意&#xff1a; 1:苹果第一行数据的营销结束日期比第二行数据的营…

sam代码简析

Segment Anything&#xff1a;建立了迄今为止最大的分割数据集&#xff0c;在1100万张图像上有超过1亿个掩码&#xff0c;模型的设计和训练是灵活的&#xff0c;其重要的特点是Zero-shot(零样本迁移性)转移到新的图像分布和任务&#xff0c;一个图像分割新的任务、模型和数据集…