Un cadre robuste d'extraction de caractéristiques multi-échelles avec un double module de mémoire pour la détection d'anomalies dans des séries temporelles multivariées

Avec le développement rapide des technologies d’apprentissage profond, l’importance des techniques de fouille de données et d’entraînement de l’intelligence artificielle dans les applications pratiques apparaît de plus en plus. En particulier dans le domaine de la détection d’anomalies des séries temporelles multivariées, bien que les méthodes existantes soient performantes, elles présentent encore des problèmes significatifs lorsqu’elles sont confrontées à des données bruyantes ou contaminées. Sur cette base, cet article propose un cadre d’extraction de caractéristiques multi-échelles avec un double module mémoire pour résoudre ces défis.

Contexte de la recherche

Les données des séries temporelles multivariées (MTS pour Multivariate Time Series) impliquent généralement l’état de fonctionnement en temps réel de plusieurs capteurs dans des applications de l’Internet des objets (IoT). Analyser efficacement ces données peut révéler des informations cachées et fournir des avertissements sur des situations anormales pour assurer le bon fonctionnement des systèmes. Cependant, les méthodes traditionnelles de détection des anomalies, telles que le Facteur Local d’Anomalie (LOF), la Machine à Vecteurs de Support à une classe (OCSVM) et la Forêt d’Isolement (IF), ne parviennent pas à capturer correctement la structure complexe et les relations non linéaires des données des séries temporelles. De plus, les méthodes basées sur la reconstruction présentent également des problèmes typiques de reconstruction des données anormales, rendant difficile la distinction entre les données normales et anormales. Par conséquent, de nouvelles méthodes efficaces doivent être développées.

Architecture de la méthode proposée dans cette étude

Source de l’article et auteurs

Cet article a été co-écrit par Bing Xue, Xin Gao, Baofeng Li, Feng Zhai, Jiansheng Lu, Jiahao Yu, Shiyuan Fu et Chun Xiao. Ces auteurs sont issus de l’École d’intelligence artificielle de l’Université de postes et télécommunications de Pékin, de la China Electric Power Research Institute Company Limited, de l’École d’ingénierie électrique et d’information de l’Université de Tianjin et du Centre de services marketing de l’État de Shanxi de State Grid. L’article a été publié dans la revue « Neural Networks » le 20 mai 2024.

Processus de recherche et méthodes

Processus de travail

Le cadre d’extraction de caractéristiques multi-échelles proposé dans cet article comprend plusieurs étapes :

  1. Fenêtres continues adjacentes comme entrée : Pour extraire les informations de dépendance locale et à long terme, des fenêtres continues adjacentes ont été conçues comme entrées.
  2. Encodeur amélioré par double mémoire : Un encodeur amélioré avec double mémoire a été proposé pour extraire des modèles typiques globaux et des caractéristiques communes locales. Cela garantit la capacité de reconstruction des données normales tout en supprimant la capacité de généralisation des données anormales.
  3. Module de fusion multi-échelle : En fusionnant différentes informations sémantiques et variables latentes de dépendance temporelle, ces variables latentes reconstruites sont utilisées pour reconstruire des échantillons pour la détection des anomalies.

Méthodes expérimentales et données

Cet article utilise cinq ensembles de données publics de différents domaines pour vérifier l’efficacité de la méthode proposée par des expériences. Ce sont :

  • MSL (Mars Science Laboratory)
  • SMAP (Soil Moisture Active Passive Satellite)
  • SMD (Server Machine Dataset)
  • PSM (Pooled Server Metrics)
  • SWAT (Secure Water Treatment)

Principaux résultats

Les résultats expérimentaux montrent que la méthode proposée dans cet article dépasse de manière significative les 16 méthodes de référence existantes sur les cinq ensembles de données différents. Plus précisément :

  1. Ensemble de données MSL : La valeur AUC-ROC atteint 0.6523, la valeur FC1 est de 0.5581, et la valeur AUC-F1PA%K est de 0.3731.
  2. Ensemble de données SMAP : La valeur AUC-ROC est de 0.5073, la valeur FC1 est de 0.2372, et la valeur AUC-F1PA%K est de 0.2782.
  3. Ensemble de données SWAT : La valeur AUC-ROC est de 0.8452, la valeur FC1 est de 0.5960, et la valeur AUC-F1PA%K est de 0.7964.
  4. Ensemble de données PSM : La valeur AUC-ROC est de 0.7581, la valeur FC1 est de 0.6350, et la valeur AUC-F1PA%K est de 0.6201.
  5. Ensemble de données SMD : La valeur AUC-ROC atteint 0.7293, la valeur FC1 est de 0.5125, et la valeur AUC-F1PA%K est de 0.3216.

Conclusion de la recherche

Cet article démontre qu’en concevant des fenêtres adjacentes continues comme entrées, en utilisant un encodeur amélioré par double mémoire et un module de fusion multi-échelle, il est possible d’améliorer de manière significative l’exactitude et la stabilité de la détection des anomalies dans les tâches de détection des anomalies des séries temporelles multivariées. Le module d’extraction des caractéristiques conçu permet de traiter efficacement le bruit et les données anormales présentes dans les données réelles, rendant les données normales reconstruites plus précises, et distinguant ainsi mieux les anomalies.

Points forts de la recherche

  1. Extraction de caractéristiques multi-échelles : Le cadre fusionne des caractéristiques multi-échelles d’informations sémantiques différentes, rendant ainsi les caractéristiques extraites plus complètes et robustes.
  2. Encodeur amélioré par double mémoire : En fusionnant des caractéristiques typiques globales et locales, le modèle améliore la capacité de reconstruction des échantillons normaux tout en supprimant efficacement les données anormales.
  3. Expériences comparatives enrichies : Des expériences riches utilisant plusieurs ensembles de données publics montrent l’applicabilité et la supériorité de la méthode proposée dans différents domaines et pour différentes données.

Autres informations de valeur

Cet article propose également un nouveau module de prétraitement des données qui peut apprendre de manière adaptative la moyenne et la variance des données, permettant de mieux gérer les caractéristiques des données variables dans le temps. De plus, une technique de fenêtre glissante ajustable de manière flexible a été adoptée pour extraire plus précisément les relations de dépendance à court et à long terme des séries temporelles. Le cadre d’extraction de caractéristiques multi-échelles proposé dans cet article offre une nouvelle solution efficace pour les tâches de détection des anomalies des séries temporelles multivariées, ayant une valeur significative non seulement pour la recherche scientifique mais aussi pour les applications industrielles en offrant un support technique solide.