Correspondance de caractéristiques via le regroupement de graphes avec consensus affine local

Correspondance des caractéristiques via le regroupement de graphes : implémentation et application de la cohérence affine locale

Contexte académique et motivation de la recherche

La mise en correspondance de caractéristiques est un problème fondamental en vision par ordinateur, essentiel dans diverses tâches telles que la reconstruction 3D, la recherche d’images, l’enregistrement d’images et la localisation et cartographie simultanées (SLAM). Cependant, dans les applications pratiques, la correspondance des caractéristiques est souvent affectée par le bruit, les points aberrants (outliers) et les transformations d’images diverses, rendant la construction de correspondances précises extrêmement difficile. Les méthodes actuelles basées sur des modèles de graphes ont montré leur efficacité pour structurer les relations, mais elles continuent de faire face à deux principaux défis : 1. Le problème d’appariement de graphes est généralement NP-difficile (NP-hard), impliquant une grande complexité de calcul. 2. La construction de graphes géométriquement significatifs reste un défi pour représenter fidèlement les relations entre points caractéristiques.

Pour résoudre ces problèmes, cet article propose une méthode GC-LAC (Graph Clustering with Local Affine Consensus), transformant le problème de mise en correspondance des caractéristiques en un problème de regroupement de graphes grâce à une stratégie affine locale et un algorithme de regroupement robuste.

Source de l’article et informations sur les auteurs

Cet article est écrit par Yifan Lu et Jiayi Ma de l’Université de Wuhan. Il est publié dans l’International Journal of Computer Vision, avec le DOI suivant : 10.1007/s11263-024-02291-5. L’article a été soumis le 9 septembre 2022 et accepté le 28 octobre 2024.

Méthodologie et processus de recherche

Vue d’ensemble de la méthode

La méthode GC-LAC se compose de deux parties principales : 1. Construction robuste de graphes : Utilisation d’une stratégie de cohérence affine locale pour construire un graphe sparse qui reflète fidèlement les relations géométriques entre points caractéristiques. 2. Regroupement robuste de graphes : Développement d’un nouvel algorithme de regroupement D2SCAN, capable d’extraire des correspondances fiables à partir de données contaminées par des outliers.

Flux de travail

1. Construction des graphes

  • Encodage de la cohérence géométrique : Chaque correspondance caractéristique est traitée comme un nœud du graphe, les poids des arêtes étant calculés en fonction de la cohérence géométrique entre les paires de points.
  • Stratégie affine locale : Les transformations d’images sont approximées par plusieurs transformations affines locales, avec des zones locales définies par une fenêtre glissante.
  • Structure de graphe sparse : Un graphe sparse est construit grâce à un a priori de cohérence de mouvement, réduisant ainsi la complexité du calcul.

2. Regroupement de graphes

  • Algorithme D2SCAN : Combinaison du regroupement par ensemble dominant et du regroupement spatial basé sur la densité (DBSCAN), introduisant une nouvelle définition de connectivité basée sur la densité et utilisant une dynamique réplicative pour optimiser la fonction objectif.

Points d’innovation

  1. Transformation de la mise en correspondance des caractéristiques en un problème de regroupement robuste de graphes, permettant de filtrer les outliers et de découvrir automatiquement des motifs visuels multiples.
  2. Proposition d’une stratégie de cohérence géométrique locale et d’un solveur géométrique efficace guidé par la cohérence de mouvement (MCDG), adaptable à différents types de transformations d’images.
  3. Développement d’un algorithme de regroupement robuste D2SCAN, moins sensible aux outliers et offrant une efficacité accrue.

Expérimentations et analyse des résultats

Paramètres expérimentaux

Les expériences ont été réalisées sur des tâches de mise en correspondance des caractéristiques dans différents scénarios, ainsi que sur des applications en estimation géométrique, détection de fermeture de boucle, et estimation de pose relative.

Jeux de données et métriques

  • Jeux de données : AdelaideRMF, VGG40, Nonrigid, entre autres.
  • Métriques : Précision, rappel, score F1 et distance géométrique symétrique (SGD).

Résultats expérimentaux

Mise en correspondance des caractéristiques

  • Analyse qualitative : Dans des scénarios complexes (déformations non rigides, mouvements multiples), GC-LAC génère des correspondances précises et robustes.
  • Comparaison quantitative : Sur les ensembles de données VGG40 et AdelaideRMF, GC-LAC dépasse les méthodes de pointe en termes de précision, rappel et efficacité.

Estimation géométrique

  • En combinant les résultats de GC-LAC avec un estimateur robuste (par exemple RANSAC), les performances sur les tâches d’estimation d’homographie et de matrice fondamentale se sont avérées supérieures à celles des autres méthodes.

Estimation de pose relative

  • Sur le jeu de données YFCC100M, GC-LAC montre une généralisation supérieure aux méthodes de pointe basées sur l’apprentissage profond, en particulier pour des scènes inédites.

Complexité algorithmique

La complexité de GC-LAC est approximativement linéaire, ce qui le rend adapté à des applications en temps réel ou à grande échelle.

Signification et valeur de la recherche

GC-LAC propose une solution efficace et généralisable pour la mise en correspondance des caractéristiques, répondant aux défis liés aux outliers et aux transformations complexes. En combinant construction de graphes sparse et regroupement robuste, cette méthode présente une forte valeur scientifique et un potentiel d’application pratique.