文章链接:http://charuaggarwal.net/ICDM-hotspot.pdf
TL;DR
文章中提出了一种在网络流图中检测出异常的hotspots的方法,设计了一个localized principal component analysisi(PCA) algorithm. 使用快速的增量特征向量更新算法来维持局部相关信息。
Algorithm/Model
利用G(t)=(N(t),A(t))表示一个时序网络,N(t) 和A(t) 表示t 时刻的nodes和edges,nijt表示边(i,j)出现的次数,T(i,j,1)...(T,i,j,nijt)表示边(i,j)出现的时间戳。文章中处理的是无向图,但是在我们项目中估计要作为有向图处理。
首先定义t时刻边(i,j)上加权的频率如下:
F(i,j,t)=k=1∑nijt2−λ⋅(t−T(i,j,k))
当边上的频率发生突然变化时,那么可能发生异常。
显然只有这部分是不够的。由于文章中的定义太多,就不详细写了,只关注我需要的部分。
t时刻节点i局部特征定义:S(i,t)={j1i(t)…j∣S(i,t)i},由直接与节点i有边相连的节点组成。Decay-based product matrixM(i,t)定义如下:
M(i,t)=∣S(i,t)∣×∣S(i,t)∣=S(i,t)TS(i,t)
设W(i,t),α(i,t)表示M(i,t)最大的特征向量及其对应的特征值,那么activity correlation change定义为:
C(t1,t2)=1−W(i,t1)⋅W(i,t1)
Activity Magnitude change 定义如下:
γ(i,t1,t2)=1−α(i,t1)⋅α(i,t1)
Experiment Detail
Thoughts
文中提出的算法对于计算graph之间的change有一定启发,但是整体定义偏多实验较少,质量一般。
联系作者