Amélioration de la reconnaissance des caractéristiques des doigts 3D via le rendu neural généralisable

Contexte et importance de la recherche

Avec le développement des technologies biométriques, la reconnaissance tridimensionnelle (3D) est devenue une tendance majeure, offrant une précision accrue, une résistance à la contrefaçon et une meilleure robustesse face à des variations d’angle de capture. Parmi les modalités explorées, la biométrie digitale 3D, qui inclut des traits tels que les empreintes digitales, les veines des doigts et les articulations, attire une attention croissante grâce à la facilité de capture et à leur usage répandu. Cependant, les méthodes actuelles, qui reposent sur une reconstruction explicite de modèles 3D, présentent deux limitations principales :

  1. Perte d’informations : les processus de reconstruction explicite entraînent inévitablement une perte de détails, affectant les performances de reconnaissance.
  2. Couplage étroit entre le matériel et l’algorithme : les algorithmes de reconstruction sont souvent spécifiques à un matériel donné, limitant leur généralisation à d’autres dispositifs ou modalités.

Pour surmonter ces obstacles, une équipe de chercheurs propose une méthode innovante basée sur les champs de radiance neuronaux (NeRF), appelée FingerNeRF, permettant d’extraire des traits 3D implicites directement depuis des images, sans passer par une reconstruction explicite des modèles 3D.


Origine de l’article

Cet article, intitulé “Improving 3D Finger Traits Recognition via Generalizable Neural Rendering”, a été rédigé par Hongbin Xu et al. de la South China University of Technology. Il a été publié dans “International Journal of Computer Vision” et soumis le 15 septembre 2023, avant d’être accepté le 14 septembre 2024.


Approche méthodologique

1. Modélisation du problème

Les méthodes traditionnelles nécessitent une reconstruction 3D explicite avant l’extraction des traits. FingerNeRF, en revanche, s’appuie sur des champs de radiance neuronaux pour modéliser directement les informations 3D, en contournant les pertes d’informations liées à la reconstruction.

2. Architecture et modules clés

L’architecture FingerNeRF comporte plusieurs innovations majeures : - Transformateur guidé par les traits (Trait Guided Transformer, TGT) : il améliore la correspondance des traits biométriques (empreintes, veines) entre les vues. - Perte de distillation de profondeur (Depth Distillation Loss, DD-Loss) : elle transfère des connaissances géométriques à partir de modèles de profondeur monoculaire avancés (comme MiDaS). - Perte de rendu guidé par les traits (Trait Guided Rendering Loss, TG-Loss) : elle cible les zones clés de l’image pour une meilleure supervision.

3. Développement de nouveaux ensembles de données

L’équipe a créé deux bases de données innovantes : - SCUT-Finger-3D : contient des images multi-vues d’empreintes digitales. - SCUT-FingerVein-3D : capture les veines des doigts à l’aide de la lumière infrarouge. Ces bases complètent les tests réalisés sur la base publique UNSW-3D.


Résultats et performances

1. Comparaison avec les méthodes explicites

Par rapport aux méthodes de reconstruction explicite basées sur des nuages de points (COLMAP), FingerNeRF présente des avantages clairs : - Avec seulement 3 vues en entrée, FingerNeRF atteint un taux d’erreur équivalente (EER) de 22,60 % sur SCUT-Finger-3D, contre 35-40 % pour les méthodes explicites. - La combinaison d’images rendues et de cartes de profondeur fournit des représentations plus riches pour les tâches de reconnaissance.

2. Robustesse sur différentes modalités

Dans SCUT-FingerVein-3D, FingerNeRF atteint une EER de 16,98 %, surpassant les méthodes explicites de 13,37 %.

3. Généralisation et qualité de rendu

Testé sur les bases SCUT et UNSW-3D, FingerNeRF excelle en termes de PSNR, SSIM et LPIPS, démontrant une supériorité dans la synthèse de nouvelles vues et la généralisation à des scénarios inédits.


Contributions principales

  1. Modélisation implicite : FingerNeRF introduit une approche unique de représentation 3D implicite pour la biométrie digitale.
  2. Support multi-modalité : Fonctionne efficacement avec différentes modalités (empreintes, veines).
  3. Nouveaux ensembles de données : Fournit des bases SCUT innovantes pour les recherches futures.
  4. Amélioration des performances : Surpasse les méthodes explicites sur toutes les métriques clés, sans exigences spécifiques en matériel.

Perspectives

FingerNeRF ouvre de nouvelles perspectives pour la biométrie 3D, avec des possibilités d’application à d’autres traits (iris, visage). Des efforts futurs pourraient optimiser les temps d’entraînement et améliorer la robustesse face à des conditions de capture complexes.


Conclusion

FingerNeRF propose une approche révolutionnaire pour la reconnaissance biométrique 3D, évitant les limitations des méthodes explicites traditionnelles. En s’appuyant sur des champs de radiance neuronaux, ce modèle implicitement supervisé offre une généralisation et des performances supérieures, faisant progresser l’état de lLa traduction complète de l’extrait a été réalisée et enregistrée dans un document intitulé “fingernerf_translation”. N’hésitez pas à me solliciter pour toute modification ou clarification.