Observations critiques dans le diagnostic à base de modèles

Dans le diagnostic de panne piloté par modèle, il est très précieux de pouvoir identifier les données d’observation clés qui conduisent à des anomalies du système. Cet article présente un cadre et un algorithme pour identifier les données d’observation clés. Ce cadre détermine quelles observations sont cruciales pour le résultat du diagnostic en abstrayant les données d’observation brutes en “sous-observations”. Une “sous-observation clé” est définie comme la sous-observation minimale qui, une fois abstraite au maximum, peut encore déduire le même ensemble de diagnostics minimaux que l’observation originale.

Cette recherche est un travail collaboratif entre Cody James Christopher d’Australie et Alban Grastien de France, respectivement du centre de données 61 de l’Organisation australienne pour la recherche scientifique et industrielle et du Commissariat à l’énergie atomique et aux énergies alternatives français. Leur travail a été publié dans le Journal of Artificial Intelligence en 2024.

Les chercheurs commencent par exposer le cadre de base et les concepts du diagnostic piloté par modèle. Ce cadre comprend trois parties principales : le modèle du système, les données d’observation et l’espace d’hypothèses de diagnostic. Le modèle du système décrit tous les comportements possibles du système ; les observations perçoivent le comportement réel du système à partir de lectures de capteurs ou de journaux ; les hypothèses de diagnostic correspondent aux modes de panne possibles du système. En comparant le comportement prédit par le modèle aux observations réelles, on peut calculer un ensemble de candidats de diagnostic cohérents. La recherche vise à identifier l’ensemble de diagnostics minimaux parmi tous les candidats.

Ensuite, les auteurs introduisent les concepts de “sous-observation” et de “sous-observation clé”. Une sous-observation est une représentation abstraite de l’observation d’origine, contenant une partie des informations de l’observation d’origine. Une sous-observation suffisante est celle qui peut déduire le même ensemble de diagnostics minimaux que l’observation d’origine. Une sous-observation clé est la plus abstraite de toutes les sous-observations suffisantes.

Pour calculer la sous-observation clé, les auteurs ont conçu un cadre d’algorithme générique. Cet algorithme part de la sous-observation correspondant à l’observation d’origine, augmente progressivement le niveau d’abstraction et élague les branches de sous-observations insuffisantes pour déduire l’ensemble de diagnostics minimaux. Une fois qu’une sous-observation suffisante est trouvée, l’algorithme continue à chercher des “sous-sous-observations” jusqu’à ce qu’aucune autre abstraction ne soit possible, obtenant ainsi une sous-observation clé. Selon le théorème, cet algorithme fournira la sous-observation clé correcte et complète, et se terminera de manière certaine.

Les chercheurs ont ensuite étendu ce cadre pour traiter les problèmes de diagnostic basés sur les observations d’état et sur les séquences d’événements observées. Pour les observations d’état, les sous-observations sont définies comme des ensembles partiels d’affectations de variables d’observation ; pour les observations d’événements, les sous-observations sont des sous-séquences de la séquence d’événements. Les auteurs décrivent comment instancier le cadre dans ces deux cas et introduisent le concept de “paires en conflit” pour optimiser davantage la recherche.

Cette recherche propose un cadre théorique et un algorithme efficaces pour identifier les données d’observation clés pour le diagnostic. Ce résultat contribue à fournir des résultats de diagnostic explicables pour les systèmes d’intelligence artificielle et des preuves à l’appui des décisions de diagnostic, améliorant ainsi la fiabilité des systèmes d’IA. Ce cadre a une certaine généralité et peut être appliqué à différents types de problèmes de diagnostic pilotés par modèle.