加载中...

ICLR 2018丨DAGMM：基于深度自编码和高斯混合模型的无监督异常检测模型

发表于2020-09-15|更新于2022-05-26|论文分享时间序列系列多元时序异常检测

|字数总计:536|阅读时长:1分钟|阅读量:|评论数:

论文标题丨 DEEP AUTOENCODING GAUSSIAN MIXTURE MODEL FOR UNSUPERVISED ANOMALY DETECTION
论文来源丨 ICLR 2018
论文链接丨 https://openreview.net/pdf?id=BJJLHbb0-
源码链接丨 https://github.com/danieltan07/dagmm

TL;DR

本文提出 DAGMM 对时间序列数据中异常位置的检测。主要思路：首先对多维数据进行降维，然后采用混合高斯模型对降维后的数据进行密度估计，最后根据密度估计结果检测异常数据。传统模型对降维后的数据进行密度估计。低维的数据会损失信息量，直接使用低维数据进行密度估计的模型容量低、效果较差。传统方法是先训练降维模型，再训练密度估计模型，没能融合两者。作者对降维后的数据进行重建，结合低维数据和重建误差进行密度估计，增大了模型的容量。此外引入正则项，联合降维模型和密度估计模型进行训练。

Algorithm/Model

数据降维后容易区分异常点：

整体 DAGMM 模型架构如下图所示

DAGMM 模型

模型分为压缩网络 (Compression Network) 和估计网络 (Estimation Network) 两个部分：

压缩网络对多维时间序列进行降维，然后对降维后的数据进行重建，最终得到降维向量和重建误差向量。
估计网络对压缩网络传过来的向量进行密度估计，最终得到样本能量，样本能量较高的为异常值，否则为正常值。

Experiments

采用数据集统计信息如下：

数据集

与不同 baselines 对比结果如下：

实验结果

Thoughts

这篇文章主要创新：

将密度估计任务得到的能量函数作为损失函数的正则化项，从而在训练过程中同时考虑了压缩网络和下游的密度估计任务（估计网络）。
采用重建误差和潜向量作为混合高斯模型的输入，来对下游的密度进行估计，这样能够避免只使用降维的潜向量带来的信息损失。

文章作者: 梦家

文章链接: https://dreamhomes.top/posts/202009151018/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自梦家博客！

异常检测多维时间序列

打赏

wechat
alipay

相关推荐

iForest 异常检测算法及其 Python 实现

SVDD：支持向量数据描述

时间序列丨基础概念理论 & 异常检测算法 & 相关学习资源 & 公开数据集

评论

TwikooValine

本地搜索