分享自:

基于动态图和实体感知归一化流的无监督多元时间序列异常检测

期刊:IEEE Transactions on Knowledge and Data EngineeringDOI:10.1109/TKDE.2024.3349613

本文介绍了一篇关于多变量时间序列(Multivariate Time Series, MTS)异常检测的研究论文,题为《Label-Free Multivariate Time Series Anomaly Detection》,由Qihang Zhou、Shibo He、Haoyu Liu、Jiming Chen和Wenchao Meng共同撰写,发表于2024年7月的《IEEE Transactions on Knowledge and Data Engineering》期刊。该研究提出了一种名为MTGFlow的无监督异常检测方法,旨在解决传统基于单类分类(One-Class Classification, OCC)的异常检测方法在训练数据中存在噪声标签时的性能下降问题。

研究背景与动机

多变量时间序列异常检测在许多实际应用中具有重要意义,例如智能工厂中的设备监控和智能电网中的传感器数据监测。传统的OCC方法假设训练数据全部为正常数据,但在实际应用中,确保训练数据完全干净是困难且成本高昂的。因此,训练数据中可能混入异常样本,导致模型性能下降。为了解决这一问题,本文提出了一种基于密度估计的无监督异常检测方法MTGFlow,该方法不依赖于干净的训练数据集,而是通过估计训练样本的密度分布来识别异常样本。

研究方法与流程

MTGFlow的核心思想是通过动态图结构和实体感知的正则化流(Normalizing Flow)来建模多变量时间序列的复杂依赖关系,并估计其密度分布。具体流程如下:

  1. 动态图结构学习:MTGFlow利用自注意力机制(Self-Attention)来学习多变量时间序列中实体之间的动态依赖关系。每个实体被视为图中的一个节点,通过自注意力机制计算节点之间的依赖关系,构建动态图结构。

  2. 时空条件生成:为了捕捉时间序列的时空特征,MTGFlow使用循环神经网络(RNN)来提取时间特征,并结合图卷积操作生成时空条件。这些条件用于后续的密度估计。

  3. 实体感知的正则化流:MTGFlow引入了实体感知的正则化流,将每个实体的时间序列映射到不同的目标分布(如高斯分布),从而实现对每个实体的独立密度估计。这种方法能够更好地捕捉不同实体的稀疏特性。

  4. 聚类策略:考虑到某些实体可能具有相似的特征,MTGFlow进一步提出了MTGFlow_Cluster,通过聚类策略将具有相似特征的实体分组,并为每个组分配相同的目标分布,从而提高密度估计的精度。

  5. 联合优化:MTGFlow和MTGFlow_Cluster的所有模块通过最大似然估计(MLE)进行联合优化,以确保整体性能的最优。

实验结果与分析

研究在六个广泛使用的基准数据集上进行了实验,包括SWAT、WADI、PSM、MSL、SMD和UCR。实验结果表明,MTGFlow和MTGFlow_Cluster在无监督和OCC设置下均表现出色,特别是在SWAT数据集上,MTGFlow比现有最先进方法(SOTA)提升了5%的性能。此外,MTGFlow在单变量时间序列数据集UCR上也表现出色,展示了其广泛的适用性。

研究结论与贡献

本文的主要贡献包括: 1. 提出了MTGFlow和MTGFlow_Cluster,能够在无标签的情况下进行多变量时间序列的异常检测。 2. 通过动态图结构学习,捕捉了多变量时间序列中实体之间的复杂依赖关系。 3. 引入了实体感知的正则化流,实现了对每个实体的独立密度估计。 4. 提出了聚类策略,进一步提高了密度估计的精度。

研究亮点

  1. 创新性:MTGFlow通过动态图结构和实体感知的正则化流,解决了传统OCC方法在训练数据中存在噪声标签时的性能下降问题。
  2. 广泛适用性:MTGFlow不仅在多变量时间序列异常检测中表现出色,还成功应用于单变量时间序列的异常检测。
  3. 鲁棒性:MTGFlow对训练数据中的异常污染具有较高的鲁棒性,适用于多种实际场景。

未来工作

未来的研究计划包括将MTGFlow应用于更多的流模型,并进一步提高其实用性。此外,研究者还计划探索如何更好地利用聚类信息来进一步提升异常检测的性能。

MTGFlow和MTGFlow_Cluster为多变量时间序列异常检测提供了一种新的无监督方法,具有较高的科学价值和应用前景。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com