【2019/ICLR】Simplifying Graph Convolutional Networks

文章链接：https://arxiv.org/pdf/1902.07153.pdf

TL;DR

考虑到GCN计算的复杂性，文章中提出的SGC在保证模型准确率不变的前提下，通过减少非线性单元和连续层之间的权值矩阵来减少计算量，提高了模型的效率因此文中的模型能适用于大型的数据集上。

至于传统的GCN形式就不过多介绍，直接说这篇文中将GCN简化的形式。文中直接移去了layers之间的Relu操作，形成线性的GCN，假设是K-layer的话，那么简化之后的GCN数学形式表达如下：

$\hat{\mathbf{Y}}=\operatorname{softmax}\left(\mathbf{S} \ldots \mathbf{S S X \Theta}^{(1)} \mathbf{\Theta}^{(2)} \ldots \Theta^{(K)}\right)$

对于一个分类任务，可以写成以下的形式：

$\hat{\mathbf{Y}}_{\mathrm{SGC}}=\operatorname{softmax}\left(\mathbf{S}^{K} \mathbf{X} \Theta\right)$

然后通过一系列的低通滤波理论来证明SGC模型的简化操作是合理的，并没看懂其中的理论推导过程，反正最后证明他们的操作是合理有效的。

最后给出他们简化后模型的pipeline：

最后在几个经典的graph dataset上测试效果，SGC首先是算的最快的，而且比其它方法还涨点了。

文中的提出的SGC模型简化了SGC的计算形式，理论上很复杂其实就是两个操作：除去Relu+计算 $S^k$ ; 如果工程上涨点这样我们也可以应用在mobile端了，有机会可以试试。