图自监督学习的最新进展:方法、策略与应用

近年来,随着深度学习在计算机视觉和自然语言处理等领域取得突破性进展,如何将其成功应用于图数据结构成为一个热门研究方向。然而,由于图数据的特殊性和标注数据获取的困难,传统的监督学习方法在图领域面临着巨大挑战。在这种背景下,自监督学习作为一种新兴的学习范式,因其无需大量人工标注就能从数据本身学习到有用表示而备受关注。本文将全面介绍图自监督学习的最新研究进展,包括主要方法、训练策略以及相关应用。

图自监督学习概述

自监督学习(Self-Supervised Learning, SSL)最早源于计算机视觉和自然语言处理领域,其核心思想是利用数据本身的结构和特征来构造监督信号,从而在无需人工标注的情况下学习到有意义的数据表示。近年来,研究人员开始将SSL的思想扩展到图数据上,形成了图自监督学习这一新兴研究方向。

根据学习方式的不同,图SSL方法大致可以分为三类:

对比学习(Contrastive Learning): 通过对比不同视图来学习表示,主要包括同尺度对比和跨尺度对比。
生成学习(Generative Learning): 通过重建图结构或节点属性来学习表示,主要包括图自编码和图自回归。
预测学习(Predictive Learning): 通过预测图的某些属性或特征来学习表示,包括节点属性预测、上下文预测等。

图自监督学习框架

图自监督学习的训练策略

在实际应用中,图SSL的训练策略主要有以下三种:

预训练-微调(Pre-training and Fine-tuning, P&F): 首先通过自监督任务预训练编码器,然后在下游任务上进行微调。
联合学习(Joint Learning, JL): 同时训练自监督任务和下游任务,使两者相互促进。
无监督表示学习(Unsupervised Representation Learning, URL): 仅使用自监督任务训练编码器,然后将学到的表示直接用于下游任务。

图自监督学习训练策略

对比学习方法

对比学习是图SSL中最为流行的方法之一,其核心思想是通过对比不同视图来学习表示。根据对比的尺度,可以分为同尺度对比和跨尺度对比两大类:

同尺度对比

全局-全局对比(Global-Global Contrasting)
- GraphCL: 通过图增强生成不同视图进行对比学习
- IGSD: 利用知识蒸馏迭代改进图表示
- DACL: 提出领域无关的对比学习方法
上下文-上下文对比(Context-Context Contrasting)
- GCC: 通过随机游走生成子图进行对比学习
局部-局部对比(Local-Local Contrasting)
- GRACE: 基于边删除和特征掩码的图对比学习
- GCA: 自适应图对比学习
- GROC: 提高图对比学习的鲁棒性

跨尺度对比

局部-全局对比(Local-Global Contrasting)
- DGI: 通过最大化局部-全球互信息学习节点表示
- MVGRL: 多视图图表示学习
局部-上下文对比(Local-Context Contrasting)
- Subg-Con: 基于子图的可扩展图对比学习
- GIC: 利用聚类信息进行图表示学习
上下文-全局对比(Context-Global Contrasting)
- MICRO-Graph: 基于图模式的对比学习
- InfoGraph: 通过最大化互信息学习图级表示

生成学习方法

生成学习方法主要通过重建图结构或节点属性来学习表示,可以分为以下两类:

图自编码(Graph Autoencoding)
- GraphMAE: 自监督掩码图自编码器
- VGAE: 变分图自编码器
图自回归(Graph Autoregression)
- GPT-GNN: 生成式预训练图神经网络
- GROVER: 自回归图表示学习

预测学习方法

预测学习方法通过预测图的某些属性或特征来学习表示,主要包括:

节点属性预测(Node Property Prediction)
- M3S: 多阶段自监督学习
- CAGNN: 上下文感知图神经网络
上下文预测(Context-based Prediction)
- GraphBERT: 基于BERT的图表示学习
- GPT-GNN: 生成式预训练图神经网络
自训练(Self-Training)
- GCN-LPA: 结合标签传播的图卷积网络
- M3S: 多视图自监督学习
领域知识预测(Domain Knowledge-based Prediction)
- Hu et al.: 基于领域知识的图预训练策略