基于双视图图表示学习的图级异常检测方法

基于双视图图-图表示学习的图级异常检测研究

学术背景

在当今数据驱动的世界中,图(Graph)作为一种强大的数据结构,被广泛应用于社交网络分析、金融欺诈检测和生物信息学等领域。图能够有效地表示复杂的关系数据,例如社交网络中的用户关系、金融交易中的资金流动以及化学分子中的原子和化学键关系。然而,随着图数据的广泛应用,如何从大量图数据中检测出异常的图样本(Graph-Level Anomaly Detection, GLAD)成为了一个重要的研究问题。

现有的GLAD方法通常依赖于图神经网络(Graph Neural Networks, GNNs)来提取图级表示,并基于这些表示进行异常检测。然而,GNNs的局限性在于其感受野(receptive field)有限,可能无法捕捉到图中潜在的异常信息。此外,现有方法往往忽略了图之间的交互关系,导致无法充分挖掘图间的异常模式。为了解决这些问题,本文提出了一种新颖的双视图图-图表示学习网络(Dual-View Graph-of-Graph Representation Learning Network),结合图变换器(Graph Transformer)技术,旨在从图内(intra-graph)和图间(inter-graph)两个视角全面探索图数据中的异常信息。

论文来源

本论文由来自中国西北师范大学计算机科学与工程学院的Wangyu Jin、Huifang Ma、Yingyue Zhang,广西师范大学教育区块链与智能技术教育部重点实验室的Zhixin Li,以及桂林电子科技大学计算机科学与信息安全学院的Liang Chang共同撰写。论文于2025年发表在期刊《Neural Networks》上,题为“Dual-View Graph-of-Graph Representation Learning with Graph Transformer for Graph-Level Anomaly Detection”。

研究流程

1. 图变换器增强的图嵌入

为了增强对图内信息的挖掘能力,本文提出了一种基于图变换器的图嵌入方法。该方法结合了GNNs和图变换器的优势,通过引入结构编码(structural encoding)来扩展GNNs的感受野。具体步骤如下:

  • GNNs嵌入:使用图同构网络(Graph Isomorphism Network, GIN)作为GNNs编码器,生成初步的节点嵌入。GIN通过多层感知机(MLP)和邻域聚合机制来提取节点特征。
  • 变换器嵌入:在传统的变换器基础上,引入了基于随机游走的结构编码,用于计算节点之间的注意力分数。通过全图注意力机制,生成变换器嵌入。
  • 图嵌入融合:将GNNs嵌入和变换器嵌入进行拼接,并通过全局平均池化(global average pooling)生成图级表示。

2. 双视图图-图表示学习

为了显式地捕捉图间的依赖关系,本文设计了一种双视图图-图表示学习模块。该模块从结构和属性两个视角构建图-图(Graph-of-Graph, GoG)表示,具体步骤如下:

  • 图-图构建:基于拓扑相似性和属性相似性,分别构建拓扑图-图(Topology-based GoG)和属性图-图(Feature-based GoG)。拓扑相似性通过最短路径核函数(shortest path kernel)计算,而属性相似性则通过余弦相似性(cosine similarity)计算。
  • 图-图传播:在构建的图-图结构上进行消息传播,使用GIN作为编码器,生成图级表示。通过最小化两个视图之间的近似误差,确保图表示的一致性。

3. 异常评分模块

为了量化每个图的异常程度,本文设计了基于重构误差的异常评分机制。具体步骤如下:

  • 单图重构误差:通过结构解码器和属性解码器,分别重构图的结构和属性信息,计算单图重构误差。
  • 图-图重构误差:在拓扑图-图和属性图-图上进行重构,计算图-图重构误差。
  • 综合异常评分:结合单图重构误差和图-图重构误差,生成综合异常评分,用于最终的异常检测。

主要结果

本文在多个真实世界的数据集上进行了广泛的实验,验证了所提出方法的有效性。实验结果表明,本文提出的方法在大多数数据集上的AUC(Area Under Curve)指标均优于现有的GLAD方法。具体结果如下:

  • 图变换器增强嵌入的有效性:通过引入图变换器,显著扩展了GNNs的感受野,提升了图内异常信息的捕捉能力。
  • 双视图图-图表示学习的有效性:通过显式地建模图间关系,有效地捕捉了图间的异常模式,提升了异常检测的准确性。
  • 异常评分机制的有效性:基于重构误差的异常评分机制能够更全面地评估图的异常程度,提高了检测的鲁棒性。

结论与意义

本文提出了一种基于双视图图-图表示学习的图级异常检测方法,结合图变换器技术,从图内和图间两个视角全面探索图数据中的异常信息。该方法不仅扩展了GNNs的感受野,还显式地建模了图间关系,生成高质量的图级表示,从而提升了异常检测的性能。本文的研究为图级异常检测提供了一种新的思路,具有重要的科学价值和实际应用意义。

研究亮点

  1. 图变换器的引入:通过结合图变换器和GNNs,显著扩展了GNNs的感受野,提升了图内异常信息的捕捉能力。
  2. 双视图图-图表示学习:通过从结构和属性两个视角构建图-图表示,显式地建模了图间关系,捕捉了图间的异常模式。
  3. 基于重构误差的异常评分机制:通过单图重构和图-图重构,生成综合异常评分,提供了更全面的异常评估。

其他有价值的信息

本文的实验结果表明,所提出的方法在多个真实世界的数据集上均表现出色,尤其是在生物信息学和社交网络数据集上,异常检测的准确性显著提升。此外,本文还详细分析了不同超参数(如邻居数量、控制系数和检测阈值)对模型性能的影响,为实际应用中的参数选择提供了指导。