TL;DR
论文中提出一种新颖的神经网络架构 LRGCN (Long Short-Term Memory R-GCN) 来动态捕获时序图中两个相邻图快照间的关系和跨时间维度的节点特征融合,根据节点特征再提出一种基于自注意力机制的路径编码模型 SAPE(self-attentive path embedding),可以将图中任意长度的路径编码成固定长度的向量再进行分类判断路径是否正常。实验中在通信网络和交通网络中验证了 LRGCN-SAPE 模型的有效性。
Problem Definition
给定节点集合V={v1,v2,⋯,vN} 表示实体,t 时刻实体间的联系可以使用邻接矩阵At 表示,Aijt∈{0,1} 为节点vj 到节点vi 是否有边相连,注意是有向图;Xt={x1t,x2t,…,xNt} 为每个节点t 时刻的观测特征,xit∈Rd 表示节点vi 在t 时刻d 个不同信号值。
graph snapshot:t 时刻对应的邻接矩阵At 和特征信号Xt;
Time-evolving graph:graph snapshot 组成的特征信号和邻接矩阵序列X={X0,X1,…,Xt},A={A0,A1,…,At},每个节点vi∈V 对应特征信号为时间序列{xi0,xi1,…,xit}。
path:时序图中长度为m 的路径为p=⟨v1,v2,…,vm⟩,对应节点的特征信号为st=⟨x1t,x2t,…,xmt⟩
需要解决的问题是给定t 时刻路径p ,根据历史M 步时间窗口数据判断未来F 步时间窗口该条路径是否存在问题,可以形式化的表示为一个分类任务:在训练集D 中学习到函数f(⋅) 可以最小化目标函数
argminL=−Pj∈D∑c=1∑CYjclogfc(Pj)
其中Pj=([sjt−M+1,…,sjt],pj,[At−M+1,…,At]) 是训练样本,Yj∈{0,1}C 表示在未来F 步中路径是否正常,fc(Pj) 表示预测路径是否正常的类别,论文中仅包含两种类型C=2。
例如通信网络示例如下:

Algorithm/Model
论文中提出的 LRGCN-SAPE 模型架构图如下所示:

主要包括两部分:
- LRGCN:捕获动态图结构和时序相关的节点特征。
- SAPE:学习路径中节点重要性并将路径编码成固定长度向量来进行分类。
LRGCN
论文中基于 R-GCN(Relational GCN) 进行改进提出了 LRGCN(Long Short-Term Memory R-GCN) 模型,主要为了对时序图中节点进行嵌入表示,同时能够包含图结构特征和时序依赖特征。
论文 Modeling relational data with graph convolutional networks 中提出 R-GCN 主要是对知识图谱中的实体和关系进行预测,定义的特征卷积形式为
Z=σ⎝⎛ϕ∈R∑(Dϕt)−1AϕtXtWϕ+XtW0⎠⎞
其中R={in,out},Aint=At 表示入边关系,Aint=(At)T 表示出边关系,(Dϕt)ii=∑j(Aϕt)ij,σ(⋅) 表示激活函数。
为了将 R-GCN 泛化论文中对卷积形式简化成如下形式,将自环视为出度和入度线性组合
Zs=σ⎝⎛ϕ∈R∑A~ϕtXtWϕ⎠⎞
其中A~ϕt=(D^ϕt)−1A^ϕt,A^ϕt=Aϕt+IN,(D^ϕt)ii=∑j(A^ϕt)ij。
那么堆积两层 R-GCN 表达式如下
Θs⋆gXt=ϕ∈R∑A~ϕtσ⎝⎛ϕ∈R∑A~ϕtXtWϕ(0)⎠⎞Wϕ(1)
📢 与原始 GCN 的区别在于
- 原始 GCN 处理的是无向图,会使Win=Wout;
- 原始 GCN 归一化方法是D−21AD−21 得到对称矩阵,但是有向图中邻接矩阵是非对称的因此使用D−1A 进行归一化。
- 有向图可以视为一个多关系图,入边和出边。
以上仅考虑了静态图中节点嵌入,以下说明时序图中节点的嵌入。
主要分为两种类型的关系:inter-time 和 intra-time

对于t 时刻相邻的两个 graph snapshots,节点计算方式如下
G−unit(Θ,[Xt,Xt−1])=σ(Θs⋆gXt+Θh⋆gXt−1)
其中Θh 表示图间固定的特征相关参数。接着为了处理时间窗口内 graph snapshots 间的特征关联,作者基于 LSTM 思路将隐藏特征进行关联
Ht=σ(ΘH⋆g[Xt,Ht−1])
其中ΘH 包括了Θs,Θh,最终得到节点表示Ω∈RN×u;
详细的计算公式可以参考论文,不再赘述,玄学的设计可以达到理论创新吧!
SAPE
这部分主要介绍如何将路径编码成固定长度的特征向量然后进行分类,还需要考虑路径中节点的重要性!
SAPE 主要的框架如下所示

对于路径P∈Rm×u ,首先使用 LSTM 捕获路径上节点间的依赖关系,
Γ=LSTM(P)
输出节点特征维度为Γ∈Rm×v,然后使用自注意机制学习节点的重要性
S=softmax(Wh2tanh(Wh1ΓT))
其中Wh1∈Rds×v 和Wh2∈Rr×ds 表示权值矩阵,得到r 个视角的S∈Rr×m 节点重要性表示,将节点权重和特征相乘得到最终固定大小的路径向量表示E∈Rr×v
E=SΓ
Experiments
论文中在两种类型的数据集上实验结果如下图所示,整体而言模型的准确率不高。

Thoughts
- 论文解决的问题较为新颖,但模型设计的较为复杂因此在实际中实用性不太高。
- 路径编码模型可以借鉴,下游可以使用不同的模型进行分类。
