论文阅读:Deep Fusion Clustering Network With Reliable Structure Preservation

论文地址:Deep Fusion Clustering Network With Reliable Structure Preservation | IEEE Journals & Magazine | IEEE Xplore

代码地址:https://github.com/gongleii/DFCN-RSP


摘要

深度聚类通过优雅地利用数据表示来寻找样本的划分,已引起广泛关注。最近,将自编码器(AE)与图神经网络(GNNs)结合,通过引入数据中隐含的结构信息,在聚类任务中取得了优秀的表现。然而,作者观察到大多数现有方法存在一些局限性:1)在实际的图数据集中,节点之间存在一些噪声或不准确的连接,这会干扰网络学习并导致偏差的表示,从而导致聚类性能不理想;2)缺乏动态信息融合模块,未能仔细结合和优化节点属性与图结构信息,进而学习到更一致的表示;3)未能充分利用两个分离视图的信息,以生成更稳健的目标分布。为了解决这些问题,作者提出了一种新方法,称为具有可靠结构保持的深度融合聚类网络(DFCN-RSP)。具体来说,引入了随机游走机制,通过度量节点之间的局部结构相似性来增强原始图结构的可靠性。该机制能够同时过滤掉噪声连接,并补充原始图中可靠的连接。此外,作者提供了一个基于变压器的图自编码器(TGAE),它可以利用自注意力机制与局部结构相似性信息逐层微调节点之间融合的拓扑结构。进一步地,作者提供了一种动态跨模态融合策略,结合了TGAE和AE学习到的表示。同时,作者设计了三元组自监督策略和目标分布生成度量,以探索跨模态信息。在五个公共基准数据集上的实验结果表明,DFCN-RSP在性能上优于现有的最先进的深度聚类算法。

引言

深度聚类在通过神经网络将数据划分为多个不重叠的组而不依赖手动标签的任务中取得了巨大成功,已成为聚类领域中不可或缺的一部分。与传统的聚类方法[1],[2],[3]不同,由于深度学习技术的强大能力,深度聚类方法逐渐成为解决数据标注问题的更自然和灵活的方式。此外,相关方法在许多应用中取得了显著成功,包括社交网络分析[4]、异常检测[5]、车辆再识别[6]和分子预训练[7]。

现有的深度聚类研究主要可以分为五类,即基于谱聚类的方法[8],[9]、基于子空间聚类的方法[10],[11]、基于生成对抗网络的方法[12],[13]、基于高斯混合模型的方法[14],[15]和基于自优化的方法[16],[17]。我们提出的方法属于最后一类。具体而言,早期的方法通过在自编码器(AE)架构中重构属性特征来学习低维空间中的数据表示。然而,由于节点属性的复杂性和非欧几里得图结构,大多数基于线性的方法无法有效地分析图结构数据[18],[19],[20]。最近,图卷积网络(GCNs)[21]在面向图的聚类任务中取得了巨大成功。例如,文献[19]提出了一种深度注意力嵌入图聚类(DAEGC)算法,该算法将节点属性和拓扑结构转化为紧凑的嵌入空间,然后通过自优化嵌入方法重构邻接矩阵。结构深度聚类网络(SDCN)[22]设计了双自监督策略和信息传递算子,将AE和GCNs集成到统一的框架中,以提高聚类性能。此外,一些先进的方法如MinCutPool[23]、AGAE[24]和ARGA[25],分别通过引入图池化策略和对抗学习技术来提高聚类性能。近年来,对比学习机制被广泛使用[26],[27];同时,基于图对比学习的聚类方法取得了显著发展,并引起了研究人员的广泛关注[28],[29],[30],[31]。

尽管上述方法通过集成节点属性和图结构信息获得了有希望的性能,但仍存在一些局限性。首先,大多数面向图的方法很少考虑优化原始图结构;然而,在实际的图数据集中,我们观察到节点之间存在一些噪声或不准确的连接,其中两个具有不同真实标签的节点保持着连接关系。这些不可靠的关系会干扰网络学习,并导致偏差的表示。其次,现有算法缺乏动态跨模态融合机制,未能仔细集成节点属性和图结构信息以学习一致的表示。来自两个信息源的表示通常是直接拼接或对齐的,导致信息交流不足。第三,在大多数现有文献中,算法未能充分利用两个信息源生成目标分布来指导网络学习。这使得学习到的图表示缺乏精确性和全面性。因此,节点属性和图结构之间的协调被切断,从而导致聚类性能不理想。

基于这些观察,作者提出了一种新方法,称为具有可靠结构保持的深度融合聚类网络(DFCN-RSP),它是作者深度融合聚类网络(DFCN)[32]的改进版,旨在解决上述问题。作者方法的关键点有三方面:1)通过随机游走机制优化原始图,可以同时过滤掉噪声连接,并补充可靠连接;2)提出了基于变压器的图自编码器(TGAE),它使用更可靠和更具信息性的拓扑结构捕捉每一层节点之间的精确连接关系,从而更好地进行表示学习;3)设计了一种动态跨模态融合策略,将结构信息和节点属性融合,以实现一致的表示学习并生成稳健的目标分布。具体而言,首先引入随机游走机制,通过度量节点之间的局部结构相似性来增强原始图结构的可靠性。通过这种方式,原始图中的噪声连接可以被过滤,同时一些可靠的连接也能得到补充。然后,受到变压器机制[33]的启发,提供了一个TGAE。将节点属性和结构信息结合起来,生成一个融合的拓扑结构,可以在每一层中实现信息的传播和高阶节点的聚合,从而提高表示学习和聚类性能。

在图1中,作者可视化了DFCN[32]中的图自编码器(GAE)和作者改进的TGAE在ACM数据集上的学习到的结构嵌入。可以观察到,作者提出的TGAE学习到了更具区分性的节点表示。此外,作者开发了一种动态跨模态融合策略,将来自图结构和节点属性的两源信息进行融合,以实现一致的表示学习。之后,为了生成更稳健的目标分布,作者估计了节点与预先计算的聚类中心之间的相似度,并在潜在嵌入空间中使用学生t分布[34]。最后,作者设计了一个三元组自监督框架,指导融合部分、AE和TGAE的学习过程,以优化网络。

作者在本工作的贡献总结如下:

  1. 提出了一种新方法DFCN-RSP,它是首个根据局部结构相似性提供加权邻接矩阵的算法,并通过更可靠和更具信息性的拓扑结构进一步提高了GCNs的效率,从而捕捉到每一层节点之间的一阶和高阶关系。
  2. 为了优化原始邻接矩阵并提升聚类性能,通过随机游走机制探索了加权邻接矩阵的生成,能够同时过滤掉噪声边并补充原始图中的可靠边。然后,TGAE提取的一阶和高阶节点关系被用于逐层微调全局拓扑结构,以寻找更具信息性的特征。
  3. 设计了一个动态跨模态融合模块,通过融合来自AE和TGAE的表示,来改善模型的泛化能力,并实现一致的表示。
  4. 在五个公共基准数据集上的实验结果验证了DFCN-RSP相比现有方法取得了优越的性能。

方法

该方法在DFCN [32]的基础上进行了改进,旨在通过随机游走技术解决由于不准确的图结构导致的偏差和弱引导问题。从图2的示意图中可以看出,提出的DFCN-RSP主要包含三个部分:通过随机游走机制优化的加权邻接矩阵、TGAE和动态信息融合模块。需要注意的是,三元组自监督策略的细节与DFCN类似,可以在相关文献[32]中找到。

加权邻接矩阵生成
在实际的图数据集中,观察到节点之间存在一些噪声或不准确的连接,其中两个具有不同真实标签的节点仍然保持连接关系。这些不可靠的关系会干扰网络学习,导致偏差的表示,从而影响聚类的性能。为了解决这个问题,引入了随机游走机制,通过衡量节点之间的局部结构相似性来增强邻接矩阵的可靠性和丰富性。它能够同时过滤掉噪声连接并增加一些可靠的连接,如图3所示。

具体而言,首先通过从中心节点开始进行k步随机游走,进行t次,构建t个随机游走矩阵 F={F1,F2,…,Ft},其中 Fi∈RN×N,k和t是两个预定义的超参数。然后,通过计算公式(1)得到平均的随机游走矩阵 Fˉ={f1,f2,…,fN}∈RN×N,并用它来构建加权邻接矩阵。这样,Fˉ 可以很好地提取并保留每个中心节点的k阶邻域信息。

之后,通过公式(2)根据 Fˉ 生成加权邻接矩阵 A~=(a~ij)N×N∈RN×N,其中 \tilde{a}_{ij} = f_i f_j^T 表示节点i与节点j之间的局部结构(即k阶邻域关系)相似度。构建的加权邻接矩阵 A~ 具有以下两个优点:一方面,它能够从高阶样本中挖掘更多潜在的有用信息,从而构建一个更具信息性的图结构;另一方面,它可以过滤掉噪声连接,减轻学习中的偏差表示问题。

其中,N(⋅)表示归一化操作。

基于Transformer的图自编码器(TGAE)

在大多数当前基于GCN的自编码器(AE)中,邻居信息的聚合过程可以表示如下:

其中,l 表示第l层,非线性激活函数 σ可以是 Tanh 或 ReLU。单位矩阵 I∈RN×N表示每个节点的自环,D=diag(d1,d2,…,dN)∈RN×N,且 d_i = \sum_{j=1}^N a_{ij}。W(l) 是第l层的可学习权重矩阵,Z(l) 是第l层的潜在表示。方程(3)意味着一阶邻居信息在表示学习中起着重要作用。按照这一原理,浅层无法捕捉到非局部信息,从而导致学习的表示不够表达,聚类性能不理想。因此,作者提出了 TGAE,它能够在每一层的潜在空间中捕捉高阶关系。接下来将分析 TGAE 的编码器和解码器。

  1. TGAE的图编码器:为了应对上述问题,将 Transformer 机制引入到 GAE 中进行非局部自注意力学习。这个学习过程主要包括三个步骤: (1)基于样本相关性的拓扑生成:遵循 Transformer 架构[33],通过以下计算获得第l层的键矩阵 K(l)∈RN×d(l)和查询矩阵 Q(l)∈RN×d(l):

其中,表示第l层的可学习网络参数,σ 是非线性激活操作(如 Tanh)。然后,通过下式计算每对节点之间的点积注意力,以生成基于样本相关性的拓扑矩阵 G(l):

  1. (2)双源结构信息融合:学习到的基于样本相关性的拓扑矩阵 G 仅依赖于样本对的特征相似性。为了进一步探索更准确的连接关系并提高其可靠性,将归一化的邻接矩阵 A~ 作为先验信息并引入它来细化 G。具体而言,通过 Hadamard 乘积操作[52]将 A~与 G 结合,如下所示:

其中,G~ 表示结合了结构和属性信息的融合拓扑矩阵。

  1. (3)通过 Transformer 进行图编码:之后,将键矩阵 K(l)作为输入,并通过以下计算获得第l层的值矩阵 V(l)∈RN×d(l):

其中,Dropout(·) 是用于数据增强的 Dropout 层。此外,通过以下公式提取第ll层的潜在嵌入矩阵 Z(l)∈RN×d(l):

与 DFCN 中的 GAE[32] 相比,所提出的 TGAE 可以在每一层探索一阶和长程关系,从而提高学习表示的区分度。

  1. 2.TGAE的图解码器:遵循 DFCN[32],将从相应的 AE 和 TGAE 中学到的属性嵌入矩阵 ZAE∈RN×d′和图嵌入矩阵 ZTGAE∈RN×d′融合,以通过以下计算获得初始融合的嵌入矩阵 ZI∈RN×d′,其中 d′是融合嵌入的维度:

其中,α是一个可学习的参数,用于平衡 Z_{AE} 和 Z_{TGAE} 的重要性,可以通过梯度下降算法自动调整。最后,通过以下计算获得聚类嵌入矩阵:

其中,Z~是输入到 AE 和 TGAE 的两个解码器的输入。

注意,提出的基于 AE 的框架是对称的,因此在解码器中,第h层的表示学习过程可以表示为:

其中,G^(h)∈RN×N和 V^(h)∈RN×d(h)分别表示图解码器第h层的融合拓扑矩阵和值矩阵。

损失函数与训练

在提出的 DFCN-RSP 中,整体损失函数包含两个部分,即重构和聚类过程:

其中,L_{AE}、L_{TGAE} 和 L_{KL} 分别表示 AE 和 TGAE 的信息重构损失以及聚类损失。预定义的超参数 β用于调整上述学习过程的相对重要性。

算法1中总结了所提出的 DFCN-RSP 的学习过程。

实验

数据集

实验结果


这一篇同样是在DFCN的基础上优化的方法,思路和性能都不错。。。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/65190.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

InnoDB存储引擎【MySQL从放弃到入门】

文章目录 InnoDB存储引擎【MySQL从放弃到入门】1.逻辑架构1.1 一条SQL语句是怎么执行的呢?1.2 MySQL存储引擎有哪些? 2.MySQL一行记录是怎么存储的?2.1 NULL值是如何存储的? 3.char和varchar的区别?4.数据页4.1 聚簇索…

Jenkins集成部署(图文教程、超级详细)

一、CI/CD 的概念 ​ CI/CD一般包含三个概念: 持续集成(Continuous Integration ,CI) 持续交付(Continuous Delivery) 持续部署(Continuous Deploy) ​ CI/CD 是现代软件开发的重要…

UE5喷涂功能

许多FPS/TPS 游戏都有喷涂、涂鸦功能 其实原理很简单,就是利用了延迟贴花实现的 我们从网上随便找一张图 创建一个材质,材质域选择延迟贴花 混合模式选择半透明,自发光强度可以看感觉调整 材质做好之后编译保存,新建一个Actor…

ECCV-2024 | 指令不够用、大模型来生成!BEVInstructor:基于BEV感知和大模型的视觉语言导航指令生成

作者:Sheng Fan, Rui Liu, Wenguan Wang, and Yi Yang 单位:浙江大学 原文链接:Navigation Instruction Generation with BEV Perception and Large Language Models (https://link.springer.com/chapter/10.1007/978-3-031-726…

电脑出现 0x0000007f 蓝屏问题怎么办,参考以下方法尝试解决

电脑蓝屏是让许多用户头疼的问题,其中出现 “0x0000007f” 错误代码更是较为常见且棘手。了解其背后成因并掌握修复方法,能帮我们快速恢复电脑正常运行。 一、可能的硬件原因 内存问题 内存条长时间使用可能出现物理损坏,如金手指氧化、芯片…

Ubuntu下ESP32-IDF开发环境搭建

Ubuntu下ESP32-IDF开发环境搭建 文章目录 Ubuntu下ESP32-IDF开发环境搭建一、前言二、软件安装三、开发环境搭建3.1 ESP-IDF安装:3.2 安装编译工具: 四、编译并烧录代码五、ESP32代码编辑工具 一、前言 ​ 开发ESP32,我们首先就要安装开发环…

Linux复习4——shell与文本处理

认识vim编辑器 #基本语法格式: vim 文件名 •如果文件存在,进入编辑状态对其进行编辑 •如果文件不存在,创建文件并进入编辑状态 例: [rootlocalhosttest]# vim practice.txt #Vim 编辑器三种模式: 命令模式&a…

5个实用的设计相关的AI网站

在这个日新月异的数字时代,我们不断面临着新的挑战和机遇。随着人工智能(AI)技术的飞速发展,越来越多的AI工具开始融入到设计相关的工作流程中,极大地提升了工作效率和创作能力。今天,我非常兴奋地向大家介…

云手机群控能用来做什么?

随着云手机的发展,云手机群控技术逐渐从小众的游戏多开工具,发展为涵盖多个领域的智能操作平台。不论是手游搬砖、短视频运营,还是账号养成等场景,云手机群控都展现出了强大的应用潜力。本文将为大家详细解析云手机群控的应用场景…

数据结构(哈希表(中)纯概念版)

前言 哈希表(Hash Table)是计算机科学中的一个基础而重要的数据结构,它广泛评估各种算法和系统中,尤其是在需要快速查找、插入和删除操作的场景中。由于其O( 1)的平均时间复杂度,存储表在性能要求较高的应用中表现得非…

Python使用requests_html库爬取掌阅书籍(附完整源码及使用说明)

教程概述 本教程先是幽络源初步教学分析掌阅书籍的网络结构,最后提供完整的爬取源码与使用说明,并展示结果,切记勿将本教程内容肆意非法使用。 原文链接:Python使用requests_html库爬取掌阅书籍(附完整源码及使用说明…

水库大坝三维模型开发bim篇

效果图 开发过程 使用了bimface 插件上传做好rvt模型到bimface工程引入bimface相关的插件代码加载模型自定义目录树定位构件闪烁构件展示构件信息 代码 技术交流加V:bloxed appKey 和appSecret 换成自己的就行 <template><div class"box-bim w100" ref&…

CSharp: Oracle Stored Procedure query table

存储过程查询postgreSQL,Oracle 和sql server,Mysql 有区别。程序调用也是有区别。 oracle sql script: CREATE OR REPLACE PROCEDURE procSelectSchool(paramSchoolId IN char,p_cursor OUT SYS_REFCURSOR ) AS BEGINOPEN p_cursor FORSELECT *FROM SchoolWHERE SchoolId p…

C语言基础——指针(4)

一&#xff0e; 字符指针变量 字符指针变量的使用和整型指针变量的使用方法相似&#xff0c;以下是其基本使用方法的例子&#xff1a; &#xff08;1&#xff09;字符指针变量还有一种使用方法&#xff1a; const char* p "abcd" 需…

Net9解决Spire.Pdf替换文字后,文件格式乱掉解决方法

官方文档 https://www.e-iceblue.com/Tutorials/Spire.PDF/Program-Guide/Text/Find-and-replace-text-on-PDF-document-in-C.html C# 在 PDF 中查找替换文本 原文件如下图&#xff0c;替换第一行的新编码&#xff0c;把41230441044替换为41230441000 替换代码如下&#xff…

【C语言程序设计——选择结构程序设计】预测你的身高(头歌实践教学平台习题)【合集】

目录&#x1f60b; 任务描述 相关知识 1、输入数值 2、选择结构语句 3、计算结果并输出 编程要求 测试说明 通关代码 测试结果 任务描述 本关任务&#xff1a;编写一个程序&#xff0c;该程序需输入个人数据&#xff0c;进而预测其成年后的身高。 相关知识 为了完成本…

【自动化测试】windows下安装Selenium浏览器界面测试工具

Date: 2024.12.23 10:15:53 author: lijianzhan 简述&#xff1a;这篇教程详细介绍了如何在Windows环境下安装selenium&#xff0c;并设置Chrome浏览器驱动。什么是Selenium&#xff1f;Selenium是一个基于浏览器的自动化测试工具&#xff0c;它提供了一种跨平台、跨浏览器的端…

前端网络之【浏览器跨域问题分析与解决方案】

文章目录 同源策略同源与异源跨域的限制场景解决方案 CORS 请求分类 简单请求预检请求 注意点一 【关于Cookie】注意点二 【关于跨域获取响应头】 JSONP 基本流程 代理服务器 如何选择对应方案 同源策略 **同源策略是一套浏览器的安全策略机制&#xff0c;当一个源的文档和脚…

老旧小区用电安全保护装置#限流式防火保护器参数介绍#

摘要 随着居民住宅区用电负荷的增加&#xff0c;用电安全问题日益突出&#xff0c;火灾隐患频繁发生。防火限流式保护器作为一种新型电气安全设备&#xff0c;能够有效预防因电气故障引发的火灾事故。本文介绍了防火限流式保护器的工作原理、技术特点及其在居民住宅区用电系统…

论文复刻:ESG表现对企业价值的影响机制研究——A股上市公司证据(2009-2023年)

参照王波&#xff08;2022&#xff09;的做法&#xff0c;对来自软科学《ESG表现对企业价值的影响机制研究——来自我国A股上市公司的经验证据》一文中的基准回归部分进行复刻 以中国2009-2023年A股上市公司为研究样本考察企业的环境、社会和治理&#xff08;ESG&#xff09;表…