−21AD−21Z(L)W(L))Dual Self-Supervised Module
Student’s t-distribution作为内核来衡量数据的表示向量hi和聚类中心向量ui 的相似性:
qij=∑j′(1+∥∥∥hi−μj′∥∥∥2/v)−2v+1(1+∥∥∥hi−μj∥∥∥2/v)−2v+1
hi 是H(L)的第i 行向量,ui 是预训练autoencoder学习到的向量表示的K-means初始化中心。qij表示样本i分配给类别j 可能性。
在获得聚类结果分布Q后,目标是通过学习高置信度赋值来优化数据表示。具体来说,希望使数据表示更接近聚类中心,从而提高聚类的内聚性。因此,计算目标分布P 如下:
pij=∑j′qij′2/fj′qij2/fj
其中fj=∑iqij是soft cluster frequencies。在目标分布P中,Q中的每一个赋值都被平方并归一化,使赋值具有更高的置信度,从而得到如下目标函数:
Lclu=KL(P∥Q)=i∑j∑pijlogqijpij
目标分布P通过最小化Q和P分布之间的KL散度损失,可以帮助DNN模块更好地表示聚类任务,即,使数据表示更接近集群中心。这被认为是一种自我监督机制,因为目标分布P是由分布Q来计算的,而P分布反过来又监督分布Q的更新。
GCN模块也提供一个聚类分配分布Z,因此可以使用分布P对分布Z进行监督:
Lgcn=KL(P∥Z)=i∑j∑pijlogzijpij
整体模型的总损失函数如下:
L=Lres+αLclu+βLgcn
选择分布Z中的 soft assignments 作为最终的聚类结果。因为GCN学习的表示包含两种不同的信息。分配给样本i 的标签为:
ri=jargmaxzij
整体算法流程如下:
Experiment details
联系作者
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 梦家博客! 打赏
wechat
alipay