论文解读（CGC）《CGC: Contrastive Graph Clustering for Community Detection and Tracking》

论文解读（CGC）《CGC: Contrastive Graph Clustering for Community Detection and Tracking》
论文信息

论文标题：CGC: Contrastive Graph Clustering for Community Detection and Tracking
论文作者：Namyong Park, Ryan Rossi, Eunyee Koh, Iftikhar Ahamath Burhanuddin, Sungchul Kim, Fan Du, Nesreen Ahmed, Christos Faloutsos
论文来源：2022, WWW
论文地址：download
论文代码：download

1 介绍

　　本文核心创新点：基于时间演化的聚类算法。2.2

　　创新点如下：
- - 网络训练过程中的多层的表示矩阵可以视为多个视图 2.1.1 2.1.3
  - 基于时间的表示交互 2.2.2
  - 高阶结构（三角结构）的应用 2.1.1
　　和其他方法对比：

　　

2 Method

2.1 CGC: Contrastive Graph Clustering

2.1.1 Multi-Level Contrastive Learning Objective

Signal: Input Node Features

　　对于节点 u，将其输入特征 fu 作为正样本，随机选择另一个节点 v，将其输入特征 fv 作为负样本；然后将这些正负样本与节点嵌入 hu 进行对比。

　　对于节点 u ，设是包含一个正样本和个负样本（）（输入特征）的集合，其中表示采样。由于输入特征和节点嵌入可以有不同的维数，所以引入参数过渡，这里定义一个基于节点特征的对比损失：

　　　　

Signal: Network Homophily

　　设表示节点的邻居，既是节点的邻居也与节点在相同的三角结构（高阶结构）；因此，。

　　从中选择节点的一个正样本，选中中的邻居的概率为，其他邻居的概率为，其中决定了中节点的权重，最后从中提取该正样本的节点嵌入。

　　为构造负样本，设计了一个破坏函数。具体来说，定义通过对进行行变换（row-wise shuffling）返回损坏的节点特征矩阵，同时保留图结构，即，可以看作是在保持图结构的同时在图上随机迁移节点。然后将GNN编码器应用于和，得到负节点嵌入，并随机选择个负样本及其嵌入。

　　设为包含节点的一个正样本（）和（）个负样本嵌入的集合。在CGC中，基于同质性的对比损失被定义为：

　　　　

Signal: Hierarchical Community Structure

　　设为聚类数集合，为第个聚类质心矩阵。给定嵌入矩阵和簇质心矩阵。节点的正样本为节点最相近的个簇质心。而其负样本是从第个其他聚类质心中随机选择的。

　　设为包含节点的一个正样本（）和个负样本（）（即质心）嵌入在质心中选择的节点𝑢。CGC定义了一个基于社区的分层对比损失为：

　　　　

Multi-Level Contrastive Learning Objective

　　多层次的对比性学习目标。上述损失项在多个层次上捕获社区结构上的信号，即单个节点特征、相邻节点和分层结构的社区。CGC联合优化

　　　　

　　其中，、、是损失项的权重。

2.1.2 Encoder Architecture

　　作为我们的节点编码器，我们使用一个带有平均聚合器的 GNN：

　　　　

2.1.3 Algorithm

　　算法如下：

　　

　　其中：
- - 代表着聚类算法，如；　　
  - 代表着聚类分配矩阵；　　
2.2 CGC for Temporal Graph Clustering

　　小结导读：后面 2.2.3 会用。

　　给定时间图流（ temporal graph stream）（其中是其中的一个图快照），学习到的节点嵌入矩阵和聚类分配矩阵基于直到之前的图快照（ snapshot）。和用于反应中的新信息。

　　为方便，这里记表示到的图快照集合，即，其中，。

　　下面将描述如何扩展 CGC 用于时间图聚类。

2.2.1 Temporal Contrastive Learning Objective

　　学习表示时，表示一般都是平稳变化。因此，在一个时间跨度范围内观察到的节点的边提供了相似或相关的时间视图。

　　给定时间戳和节点，我们将时间戳时的嵌入作为其正样本。

　　为获得负样本，使用 2.1.1节中使用的破坏函数，得损坏节点特征矩阵，使用并视节点对应的嵌入作为负样本（这里的其实不是节点，只是位置对应其他节点）。打乱多次特征矩阵，重复上述过程，便可以得到多组负样本。【个人觉得完全有点多此一举，反正都是负样本还不如直接随机选取个样本】

　　设包含节点的一个正样本（）和个负样本（）。CGC定义了一个在时间的对比损失：

　　　　

　　请注意，与第 2.1.1 节中讨论的目标相结合，其权重为，将损失增加为

　　　　

2.2.2 Encoder Architecture

　　对 GNN 编码器进行扩展：使得节点给予最近与该节点交互的邻居更多权重，所以需要根据邻居最近交互的时间来调整邻居权重。

　　设表示节点和之间边的时间戳，并设，即节点与其邻居交互时的最新时间戳。表示时间衰减因子，我们将时间衰减应用于邻域的嵌入如下：

　　　　

　　然后对于具有时间感知能力的邻域聚合，将中的替换为其时间衰减版本。

2.2.3 Graph Stream Segmentation

　　合并之前的快照生成新快照是基于前后的相似性假设，然而在训练时网络可能产生突变，导致新的快照在某种程度上和之前并不一致，所以需要检测这些变化。

　　设是到 () 之间的图流段（graph stream segment）。给定一个快照，如果与相似，我们使用扩展当前段；如果不相似，将启动一个只由组成的新的图流段。【该问题为流式图分割问题】

　　解决这个问题的想法是比较出现在和两者中的节点嵌入。

　　这一步的 GNN 编码器已经基于训练好了，但并没有在训练。如果和相似，他们对应的表示也相似。那么接下来分析与不相似的情况。

　　设表示同时出现在和之中的节点集合，设分别表示基于、的表示。这里定义距离度量函数（cosine distance），和之间的距离定义为：

　　　　

　　如果距离超过了一个阈值，则对流进行分段。

　　CGC Framework：

　　

　　GraphStreamSegmentation 算法如下：

　　

2.2.4 Putting Things Together

　　CGC在一个增量的端到端框架(Alg. 2).当一个新的图形快照到达时，CGC使用 Alg. 3 (line 3) 自适应地确定一个要从中查找簇的图形快照序列，并使用 Alg. 1 (line 4) 更新聚类结果和节点嵌入。

3 Experiments

数据集：基本数据集

　　

数据集：图流

　　

基线实验

　　

　　

消融实验

　　

相关论文

聚类算法 [20, 36, 37, 63–65, 67]

深度图聚类算法 [6, 40, 48, 57, 61]

两阶段的 DGC 模型：[28, 57]

基于图自编码器的聚类算法：[28]

基于联合优化框架的聚类算法：[6, 48, 61]
论文信息
1 介绍
2 Method
    2.1 CGC: Contrastive Graph Clustering
        2.1.1 Multi-Level Contrastive Learning Objective
        2.1.2 Encoder Architecture
        2.1.3 Algorithm
    2.2 CGC for Temporal Graph Clustering
        2.2.1 Temporal Contrastive Learning Objective
        2.2.2 Encoder Architecture
        2.2.3 Graph Stream Segmentation
        2.2.4 Putting Things Together
3 Experiments
相关论文
__EOF__
本文作者： Blair
本文链接： https://www.cnblogs.com/BlairGrowing/p/16175961.html
关于博主： 评论和私信会在第一时间回复。或者直接私信我。
版权声明： 本博客所有文章除特别声明外，均采用 BY-NC-SA 许可协议。转载请注明出处！
声援博主： 如果您觉得文章对您有帮助，可以点击文章右下角【推荐】一下。

论文信息

1 介绍

2 Method

2.1 CGC: Contrastive Graph Clustering

2.1.1 Multi-Level Contrastive Learning Objective

2.1.2 Encoder Architecture

2.1.3 Algorithm

2.2 CGC for Temporal Graph Clustering

2.2.1 Temporal Contrastive Learning Objective

2.2.2 Encoder Architecture

2.2.3 Graph Stream Segmentation

2.2.4 Putting Things Together

3 Experiments

相关论文