文章链接:https://arxiv.org/pdf/1902.07153.pdf

TL;DR

考虑到GCN计算的复杂性,文章中提出的SGC在保证模型准确率不变的前提下,通过减少非线性单元和连续层之间的权值矩阵来减少计算量,提高了模型的效率因此文中的模型能适用于大型的数据集上。

Dataset/Algorithm/Model

至于传统的GCN形式就不过多介绍,直接说这篇文中将GCN简化的形式。文中直接移去了layers之间的Relu操作,形成线性的GCN,假设是K-layer的话,那么简化之后的GCN数学形式表达如下:

Y^=softmax(SSSXΘ(1)Θ(2)Θ(K))\hat{\mathbf{Y}}=\operatorname{softmax}\left(\mathbf{S} \ldots \mathbf{S S X \Theta}^{(1)} \mathbf{\Theta}^{(2)} \ldots \Theta^{(K)}\right)

对于一个分类任务,可以写成以下的形式:

Y^SGC=softmax(SKXΘ)\hat{\mathbf{Y}}_{\mathrm{SGC}}=\operatorname{softmax}\left(\mathbf{S}^{K} \mathbf{X} \Theta\right)

然后通过一系列的低通滤波理论来证明SGC模型的简化操作是合理的,并没看懂其中的理论推导过程,反正最后证明他们的操作是合理有效的。

最后给出他们简化后模型的pipeline:

Experiment Detail

最后在几个经典的graph dataset上测试效果,SGC首先是算的最快的,而且比其它方法还涨点了。

Thoughts

文中的提出的SGC模型简化了SGC的计算形式,理论上很复杂其实就是两个操作:除去Relu+计算SkS^k; 如果工程上涨点这样我们也可以应用在mobile端了,有机会可以试试。

联系作者