Réseau Transformer Vision-Langage avec Attention Dynamique pour la Ré-Identification des Personnes

Rapport de recherche sur le réseau Transformer vision-langage à attention dynamique pour la réidentification de personnes Ces dernières années, la technologie de réidentification de personnes multimodale (Person Re-Identification, ReID) a suscité un intérêt croissant dans le domaine de la vision par ordinateur. La réidentification de personnes vise...

Corrélation d'échantillons pour l'empreinte digitale de la reconnaissance faciale profonde

Détection et protection contre le vol de modèles dans la reconnaissance faciale profonde : une étude innovante basée sur la corrélation des échantillons Contexte et problématique Les progrès rapides des techniques d’apprentissage profond ont considérablement stimulé le domaine de la reconnaissance faciale ces dernières années. Toutefois, les modèle...

Une méthode basée sur l'incertitude de déplacement pour le suivi multi-objets dans des vidéos à faible fréquence d'images

Rapport académique : Suivi multi-objets à basse fréquence d’images Introduction et contexte de recherche Ces dernières années, le suivi multi-objets (MOT) s’est imposé comme une technologie clé dans des domaines tels que la surveillance vidéo intelligente, la conduite autonome et la vision robotique. Cependant, les méthodes MOT conventionnelles son...

Vaccin Anti-Faux : Protéger la Vie Privée Contre les Échanges de Visages par une Double Dégradation Visuelle et Sémantique

Rapport Académique: Protection de la Vie Privée Contre les Profondeurs Faux Grâce au « Anti-Fake Vaccine » Introduction et Motivation Ces dernières années, les techniques de faux profonds (deepfake) ont présenté des défis importants à la confidentialité personnelle et à la sécurité sociale. Les techniques de substitution de visage, largement utilis...

Segmentation sémantique faiblement supervisée des scènes de conduite basée sur quelques pixels annotés et des nuages de points

Basé sur quelques pixels annotés et des données de nuages de points pour la segmentation sémantique faiblement supervisée des scènes de conduite Contexte et problème de recherche La segmentation sémantique, en tant que tâche essentielle de la vision par ordinateur, trouve de nombreuses applications dans des domaines tels que la conduite autonome. C...

Repenser les techniques contemporaines d'apprentissage profond pour la correction d'erreurs dans les données biométriques

Introduction et contexte Avec le développement de la technologie de l’information, l’utilisation des données biométriques dans l’authentification et le stockage sécurisé est devenue de plus en plus répandue. La cryptographie traditionnelle repose généralement sur des chaînes aléatoires uniformément distribuées et précisément reproductibles, mais da...

Reconnaissance d'activités pseudo-supervisée au-delà de la lumière du jour

Points forts de la recherche : Reconnaissance d’activités en basse luminosité avec apprentissage pseudo-supervisé et fusion audio-visuelle adaptative Contexte scientifique Cette étude explore les défis liés à la reconnaissance d’activités dans des environnements à faible luminosité. Les techniques actuelles de reconnaissance d’activités offrent de ...

EfficientDeRain+: Apprentissage du filtrage sensible à l'incertitude via l'augmentation RainMix pour un dépluvage à haute efficacité

Méthode efficace de dépluvage d’image : réseau profond optimisé pour un dépluvage rapide avec augmentation de données Contexte Les conditions pluvieuses affectent significativement la qualité des images et vidéos capturées par les systèmes de vision par ordinateur, avec des artefacts tels que des gouttes ou des traînées de pluie qui perturbent les ...

Apprentissage de l'alignement des modalités intermédiaires adaptatives pour la réidentification des personnes visible-infrarouge

Apprentissage de l'alignement des modalités intermédiaires adaptatives pour la réidentification des personnes visible-infrarouge

Étude sur la méthode d’alignement adaptatif des modalités intermédiaires pour l’apprentissage entre la lumière visible et l’infrarouge Contexte et problématique de la recherche Avec l’essor des systèmes de surveillance intelligente, la ré-identification de personnes en lumière visible et infrarouge (Visible-Infrared Person Re-identification, VIReID...

Correspondance de caractéristiques via le regroupement de graphes avec consensus affine local

Correspondance des caractéristiques via le regroupement de graphes : implémentation et application de la cohérence affine locale Contexte académique et motivation de la recherche La mise en correspondance de caractéristiques est un problème fondamental en vision par ordinateur, essentiel dans diverses tâches telles que la reconstruction 3D, la rech...