Double espace vidéo piéton reconnaissance lourde

 

Recherche sur l’identification vidéo de personnes dans un espace dual Introduction au contexte La technologie d’identification de personnes (Person Re-Identification, ReID) vise à identifier des individus spécifiques à travers des images ou des séquences vidéo capturées par différentes caméras. Ces dernières années, avec le développement rapide de ...

TryOn-Adapter : Adaptation d'identité vestimentaire à grain fin efficace pour une expérience de virtual try-on haute fidélité

TryOn-Adapter : Adaptation d'identité vestimentaire à grain fin efficace pour une expérience de virtual try-on haute fidélité

TryOn-Adapter — Adaptation d’identité vestimentaire fine et efficace pour essayage virtuel haute fidélité Contexte de recherche et problématique La technologie d’essayage virtuel (Virtual Try-On) a suscité une attention croissante ces dernières années. Son objectif principal est d’ajuster les vêtements donnés sur une personne spécifique de manière ...

Apprentissage et régularisation de la représentation découplée par contraste pour la manipulation des expressions faciales préservant la parole

Apprentissage par Représentation Découplée Contrastive pour la Manipulation des Expressions Faciales en Préservant la Voix Introduction Ces dernières années, avec le développement rapide de la réalité virtuelle, de la production cinématographique et des technologies d’interaction homme-machine, la manipulation des expressions faciales est devenue u...

DiffuVolume : Modèle de diffusion pour l'appariement stéréo basé sur le volume

 

DiffuVolume - Une nouvelle méthode de stéréo matching basée sur le modèle de diffusion Contexte de recherche et problématique Le stéréo matching (Stereo Matching) est une tâche essentielle dans le domaine de la vision par ordinateur, avec des applications largement répandues dans les domaines de la conduite autonome et de la navigation robotique. S...

Apprentissage de la représentation faciale cohésive et consciente de la posture par apprentissage contrastif

Améliorer la perception des poses dans l’apprentissage autodidacte de représentations faciales Contexte de recherche et problématique Dans le domaine de la vision par ordinateur, l’apprentissage des représentations faciales (Facial Representation Learning) est une tâche importante. En analysant les images faciales, nous pouvons extraire des informa...

Un cadre de supervision mutuelle pour la segmentation et la génération d'expressions de référence

Un cadre de supervision mutuelle pour la segmentation et la génération d'expressions de référence

Un cadre de supervision mutuelle pour la segmentation et la génération d’expressions référentielles Contexte de recherche et problématique Ces dernières années, les technologies d’interaction vision-langage ont connu des progrès significatifs dans le domaine de l’intelligence artificielle. Parmi elles, la segmentation d’expressions référentielles (...

Appariement maximal de concepts global et local pour la détection zéro-shot hors distribution

Appariement maximal de concepts global et local pour la détection zéro-shot hors distribution

GL-MCM : Correspondance maximale globale et locale pour la détection hors distribution en zéro-shot Contexte de recherche et problématique Dans les environnements réels d’application des modèles d’apprentissage automatique, les données peuvent souvent présenter des changements dans leur distribution, par exemple l’apparition de nouvelles catégories...

Pré-entraînement géométrique guidé par Lidar pour la détection d'objets 3D centrée sur la vision

Pré-entraînement géométrique guidé par Lidar pour la détection d'objets 3D centrée sur la vision

Amélioration des performances de la détection d’objets 3D centrée sur la vision grâce à une méthode de pré-entraînement géométrique guidée par LiDAR Introduction Ces dernières années, la détection d’objets 3D multi-caméras dans le domaine de la conduite autonome a suscité une attention considérable. Cependant, les méthodes basées sur la vision renc...

Une étude expérimentale sur l'exploration de transformateurs de vision légers robustes via un pré-entraînement par modélisation d'image masquée

Une étude expérimentale sur l’exploration de puissants transformateurs visuels légers via le pré-entraînement par modélisation d’image masquée Contexte académique Ces dernières années, l’apprentissage auto-supervisé (self-supervised learning, SSL) a fait des progrès significatifs dans le domaine de la vision par ordinateur. En particulier, la métho...

Établissement de circuits dopaminergiques fonctionnellement séparés

Les circuits dopaminergiques fonctionnellement séparés et leurs mécanismes de développement Contexte académique La dopamine est un neurotransmetteur essentiel dans le cerveau, impliqué dans la régulation de diverses fonctions physiologiques, telles que le contrôle moteur, la régulation des émotions, la motivation, l’apprentissage et la mémoire. Les...