Amélioration de la reconnaissance des caractéristiques des doigts 3D via le rendu neural généralisable

Contexte et importance de la recherche Avec le développement des technologies biométriques, la reconnaissance tridimensionnelle (3D) est devenue une tendance majeure, offrant une précision accrue, une résistance à la contrefaçon et une meilleure robustesse face à des variations d’angle de capture. Parmi les modalités explorées, la biométrie digital...

Un cadre de transfert de connaissances assisté par mémoire avec anticipation curriculaire pour la détection d'activités en ligne faiblement supervisée

Contexte et pertinence de l’étude Ces dernières années, la détection d’activités en ligne faiblement supervisée (Weakly Supervised Online Activity Detection, WS-OAD), en tant que sujet important de compréhension vidéo avancée, a suscité une attention croissante. Son objectif principal est de détecter image par image les activités en cours dans des ...

Réseau Transformer Vision-Langage avec Attention Dynamique pour la Ré-Identification des Personnes

Rapport de recherche sur le réseau Transformer vision-langage à attention dynamique pour la réidentification de personnes Ces dernières années, la technologie de réidentification de personnes multimodale (Person Re-Identification, ReID) a suscité un intérêt croissant dans le domaine de la vision par ordinateur. La réidentification de personnes vise...

Reconnaissance d'activités pseudo-supervisée au-delà de la lumière du jour

Points forts de la recherche : Reconnaissance d’activités en basse luminosité avec apprentissage pseudo-supervisé et fusion audio-visuelle adaptative Contexte scientifique Cette étude explore les défis liés à la reconnaissance d’activités dans des environnements à faible luminosité. Les techniques actuelles de reconnaissance d’activités offrent de ...

EfficientDeRain+: Apprentissage du filtrage sensible à l'incertitude via l'augmentation RainMix pour un dépluvage à haute efficacité

Méthode efficace de dépluvage d’image : réseau profond optimisé pour un dépluvage rapide avec augmentation de données Contexte Les conditions pluvieuses affectent significativement la qualité des images et vidéos capturées par les systèmes de vision par ordinateur, avec des artefacts tels que des gouttes ou des traînées de pluie qui perturbent les ...

Apprentissage de l'alignement des modalités intermédiaires adaptatives pour la réidentification des personnes visible-infrarouge

Apprentissage de l'alignement des modalités intermédiaires adaptatives pour la réidentification des personnes visible-infrarouge

Étude sur la méthode d’alignement adaptatif des modalités intermédiaires pour l’apprentissage entre la lumière visible et l’infrarouge Contexte et problématique de la recherche Avec l’essor des systèmes de surveillance intelligente, la ré-identification de personnes en lumière visible et infrarouge (Visible-Infrared Person Re-identification, VIReID...

Un cadre d'alignement collaboratif faiblement supervisé pour l'analyse des vidéos procédurales

Cadre d’alignement collaboratif des procédures sous supervision faible : Applications et évaluations dans l’apprentissage de la corrélation vidéo pour les vidéos pédagogiques Ces dernières années, avec le développement rapide de l’analyse vidéo, les vidéos pédagogiques attirent de plus en plus l’attention des chercheurs en raison de leur nature axé...

Adaptation de domaine générative en un coup dans les GANs 3D

Adaptation Générative de Domaine One-shot pour GANs 3D Ces dernières années, les réseaux antagonistes génératifs (Generative Adversarial Networks, GANs) ont réalisé des progrès significatifs dans la génération d’images. Les modèles génératifs traditionnels en 2D ont démontré des capacités impressionnantes dans de nombreuses tâches. Cependant, étend...

Évaluation fiable des cartes d'attribution dans les CNN : une approche basée sur les perturbations

Évaluation fiable des cartes d’attribution dans les CNNs : une approche basée sur les perturbations Contexte et motivation de la recherche Avec le succès croissant des modèles d’apprentissage profond dans diverses tâches, la communauté scientifique met de plus en plus l’accent sur leur explicabilité et leur transparence. Bien que ces modèles excell...

Modèle binaire local de co-occurrence multi-échelle pour la classification d'images

Recherche sur la classification d’images basée sur le modèle local binaire de co-occurrence multi-échelle La technique de classification d’images occupe une place centrale dans le domaine de la vision par ordinateur, et l’extraction de caractéristiques visuelles constitue un pilier de cette recherche. Récemment, le modèle local binaire (Local Binar...