Vers l'amélioration de la détection hors distribution à partir d'une perspective d'importance des caractéristiques spatiales
Amélioration de la détection des distributions extérieures sous l’angle de l’importance des caractéristiques spatiales
Contexte de recherche et formulation du problème
Dans les applications pratiques des modèles d’apprentissage profond, assurer que le modèle peut refuser de manière fiable les prédictions face à des entrées de catégories inconnues est essentiel pour garantir la sécurité et la robustesse du système. Ce besoin a donné naissance au domaine de recherche appelé détection des distributions extérieures (Out-of-Distribution Detection, OOD Detection). La détection OOD vise à distinguer les échantillons appartenant à la distribution des données d’entraînement (c’est-à-dire les échantillons intra-distribution, In-Distribution, ID) de ceux qui se situent en dehors de cette plage (c’est-à-dire les échantillons hors distribution, Out-of-Distribution). Ces dernières années, les chercheurs ont proposé divers critères de détection, tels que MSP (Maximum Softmax Probability), Energy Score, GradNorm, etc., afin de construire une zone de rejet pour le modèle et identifier comme étant hors distribution les échantillons tombant dans cette zone.
Cependant, les méthodes actuelles calculent généralement ces critères de détection à partir de toutes les caractéristiques denses (dense features) du modèle, ignorant le fait que différentes caractéristiques peuvent avoir des niveaux d’importance variés dans le processus décisionnel. Cette approche “uniforme” peut entraîner une interférence due à des caractéristiques redondantes ou non pertinentes, limitant ainsi l’amélioration des performances de détection. Pour répondre à ce problème, les auteurs proposent une nouvelle perspective : examiner la tâche de détection OOD sous l’angle de l’importance des caractéristiques spatiales et tenter d’améliorer les performances de détection en purifiant les caractéristiques non essentielles.
Origine de l’article et informations sur les auteurs
Cet article intitulé « Towards Boosting Out-of-Distribution Detection from a Spatial Feature Importance Perspective » a été rédigé conjointement par Yao Zhu (Université de Zhejiang), Xiu Yan (groupe Meituan) et Chuanlong Xie (Université normale de Pékin). Il a été publié dans la revue internationale de premier plan en vision par ordinateur, International Journal of Computer Vision (IJCV). L’article a été accepté le 6 janvier 2025 et publié en ligne en 2025. Cette recherche a bénéficié du soutien de la Fondation nationale des sciences naturelles de Chine (No. 12201048).
Processus de recherche et méthodologie
1. Méthode d’attribution des caractéristiques orientée spatialement (Spatial-Oriented Feature Attribution)
Pour quantifier l’importance des différentes positions spatiales dans les caractéristiques denses, les auteurs proposent pour la première fois une méthode d’attribution des caractéristiques orientée spatialement basée sur la valeur de Shapley (Shapley Value). La valeur de Shapley est un outil mathématique issu de la théorie des jeux coopératifs, utilisé pour mesurer la contribution de chaque joueur au gain global. Dans cette étude, chaque caractéristique spatiale des caractéristiques denses est considérée comme un “joueur”, et sa contribution marginale à la prédiction du modèle est calculée à l’aide de la formule suivante :
[ φ_{ai} = \frac{1}{HW} \sum{q=1}^{HW} \frac{1}{\binom{HW-1}{q-1}} \sum_{s \in Sq(i)} Δ{a_i}(s) ]
où (Δ_{a_i}(s)) représente la variation de la prédiction du modèle lorsqu’on ajoute la caractéristique (a_i); (S_q(i)) est l’ensemble de tous les sous-ensembles de taille (q) ne contenant pas (a_i). Étant donné le coût élevé du calcul direct des valeurs de Shapley, les auteurs utilisent une méthode d’échantillonnage Monte Carlo pour approximer ces valeurs.
Grâce à cette méthode, les auteurs génèrent une carte d’importance des caractéristiques (Feature Importance Map), qu’ils mettent ensuite à l’échelle de la taille de l’image d’entrée pour former une carte thermique (Heatmap). Ces cartes thermiques permettent non seulement de refléter visuellement les régions clés du processus décisionnel du modèle, mais surpassent également les méthodes existantes de la série CAM (Class Activation Mapping) en termes de fidélité locale (Local Fidelity) et globale (Global Fidelity).
2. Méthode de purification des caractéristiques spatiales (Spatial Feature Purification, SFP)
Sur la base de la méthode d’attribution des caractéristiques ci-dessus, les auteurs proposent une méthode de purification des caractéristiques spatiales (SFP). Concrètement, SFP utilise la carte d’importance des caractéristiques pour supprimer les caractéristiques spatiales moins importantes dans les caractéristiques denses tout en conservant celles qui sont plus cruciales pour la prise de décision du modèle. Les caractéristiques purifiées sont ensuite utilisées pour calculer les critères de détection, améliorant ainsi les performances de détection.
Les étapes spécifiques de SFP sont les suivantes : 1. Trier la carte d’importance des caractéristiques par ordre croissant pour obtenir une liste triée des importances. 2. En fonction du ratio de purification (r) défini, sélectionner les (n = \lfloor r \cdot HW \rfloor) caractéristiques les moins importantes. 3. Mettre ces caractéristiques à zéro pour générer une carte de caractéristiques purifiée.
Conception expérimentale et validation
Jeux de données et modèles
Pour valider l’efficacité de SFP, les auteurs ont mené des expériences sur plusieurs ensembles de données de référence, y compris ImageNet à grande échelle et sa variante ImageNet-V2, ainsi que CIFAR-100 à petite échelle. Les architectures de modèles testées incluent plusieurs types, tels que CNN (par exemple ResNet-50, ResNetV2) et Transformer (par exemple Swin-Tiny, TinyViT).
Critères de détection
Les auteurs ont comparé les performances de sept critères de détection OOD courants (tels que Energy Score, KNN, ViM, etc.) ainsi que trois méthodes de post-traitement de modèle (telles que DICE, ASH, LINE).
Indicateurs d’évaluation des performances
Les expériences utilisent deux principaux indicateurs d’évaluation : FPR95 (Taux de faux positifs à 95 % de taux de vrais positifs) et AUROC (Aire sous la courbe ROC). Plus le FPR95 est bas et l’AUROC est élevé, meilleures sont les performances de détection.
Résultats principaux et analyse
1. Performances de la méthode d’attribution des caractéristiques
Les résultats expérimentaux montrent que la méthode d’attribution des caractéristiques proposée par les auteurs surpasse les méthodes existantes de la série CAM en termes de fidélité locale et globale. Par exemple, en supprimant les pixels les plus pertinents, la méthode des auteurs réduit significativement la confiance de prédiction du modèle ; tandis qu’en supprimant les pixels les moins pertinents, la variation de la confiance du modèle reste faible. Cela indique que cette méthode est capable de capturer plus précisément les régions clés du processus décisionnel du modèle.
2. Amélioration des performances de détection grâce à SFP
Dans les tests sur le benchmark ImageNet, SFP améliore significativement les performances de divers critères de détection. Par exemple, pour Energy Score, SFP réduit en moyenne le FPR95 de 18,39 % sur le modèle ResNet-50, tandis que pour ViM, le FPR95 est réduit de 26,45 %. De plus, sur le jeu de données ImageNet-V2, SFP donne également d’excellentes performances, en particulier dans des scénarios de décalage de distribution naturelle où les gains de performance sont encore plus marqués.
3. Compatibilité et extensibilité
Les auteurs ont également vérifié la compatibilité de SFP avec d’autres méthodes de post-traitement de modèle. Les résultats expérimentaux montrent que SFP peut encore améliorer les performances des méthodes de post-traitement existantes (telles que DICE, ASH, LINE). Par exemple, lorsqu’il est combiné avec Energy Score, SFP réduit le FPR95 de DICE de 79,58 % à 55,41 %.
Conclusion et signification
Valeur scientifique
Cette recherche examine la tâche de détection OOD sous l’angle de l’importance des caractéristiques spatiales, révélant l’impact négatif potentiel des caractéristiques non essentielles sur les performances de détection. En introduisant la méthode SFP, les auteurs ont réussi à améliorer les performances de divers critères de détection, démontrant le potentiel de purification des caractéristiques pour renforcer la robustesse des modèles.
Valeur pratique
SFP, en tant que méthode “plug-and-play”, peut être intégrée de manière transparente dans les cadres de détection OOD existants, offrant de vastes perspectives d’application. En particulier dans des domaines à haut risque tels que la conduite autonome et le diagnostic médical, SFP peut aider les modèles à identifier plus précisément les catégories inconnues, améliorant ainsi la sécurité du système.
Points forts de la recherche
- Perspective novatrice : Redéfinir les obstacles dans la tâche de détection OOD sous l’angle de l’importance des caractéristiques spatiales.
- Méthode innovante : Première application des valeurs de Shapley à l’attribution des positions spatiales dans les caractéristiques denses, proposant une méthode d’attribution de caractéristiques efficace et fidèle.
- Large applicabilité : SFP est applicable à diverses architectures de modèles et critères de détection, montrant une forte compatibilité et extensibilité.
Cette recherche offre une nouvelle perspective pour comprendre les mécanismes internes des modèles profonds et trace la voie pour l’avenir du domaine de la détection OOD.