Seaformer++ : Transformateur axial à compression améliorée pour la reconnaissance visuelle mobile

SEAFormer++ - Une architecture Transformer efficace conçue pour la reconnaissance visuelle mobile Contexte de recherche et problématique Ces dernières années, le domaine de la vision par ordinateur a connu un changement majeur, passant des réseaux neuronaux convolutionnels (CNN) aux méthodes basées sur les Transformers. Cependant, bien que les Visi...

Pré-entraînement géométrique guidé par Lidar pour la détection d'objets 3D centrée sur la vision

Pré-entraînement géométrique guidé par Lidar pour la détection d'objets 3D centrée sur la vision

Amélioration des performances de la détection d’objets 3D centrée sur la vision grâce à une méthode de pré-entraînement géométrique guidée par LiDAR Introduction Ces dernières années, la détection d’objets 3D multi-caméras dans le domaine de la conduite autonome a suscité une attention considérable. Cependant, les méthodes basées sur la vision renc...

Une étude expérimentale sur l'exploration de transformateurs de vision légers robustes via un pré-entraînement par modélisation d'image masquée

Une étude expérimentale sur l’exploration de puissants transformateurs visuels légers via le pré-entraînement par modélisation d’image masquée Contexte académique Ces dernières années, l’apprentissage auto-supervisé (self-supervised learning, SSL) a fait des progrès significatifs dans le domaine de la vision par ordinateur. En particulier, la métho...

Cadre Unifié de Distillation Pondérée par Échantillon Basé sur des Prototypes Adapté à l'Analyse de Sentiment de Modalité Manquante

Cadre Unifié de Distillation Pondérée par Échantillon Basé sur des Prototypes Adapté à l'Analyse de Sentiment de Modalité Manquante

Application d’un cadre unifié de distillation pondérée basé sur des prototypes à l’analyse des émotions en cas de modalités manquantes Contexte de la recherche L’analyse des émotions est un domaine important du traitement automatique des langues (TAL). Avec le développement des plateformes de médias sociaux, les gens préfèrent de plus en plus expri...

Apprentissage Fédéré Semi-Supervisé Model-Hétérogène pour la Segmentation d'Images Médicales

Apprentissage Fédéré Semi-Supervisé Model-Hétérogène pour la Segmentation d'Images Médicales

Modèle Hétérogène de Fédération Apprentissage Semi-Supervisé pour la Segmentation d’Images Médicales Introduction La segmentation des images médicales joue un rôle crucial dans le diagnostic clinique en aidant les médecins à identifier et analyser les pathologies. Cependant, cette tâche est souvent confrontée à des défis tels que les données sensib...

Équilibrer l'Alignement des Caractéristiques et l'Uniformité pour la Classification avec Peu d'Échantillons

Équilibrer l'Alignement des Caractéristiques et l'Uniformité pour la Classification avec Peu d'Échantillons

Alignement et Uniformité des Caractéristiques Équilibrées pour Résoudre le Problème de Classification avec Peu d’Échantillons Contexte et Motivation L’apprentissage avec peu d’échantillons (Few-Shot Learning, FSL) vise à reconnaître correctement de nouveaux échantillons dans des classes nouvelles avec seulement quelques exemples disponibles. Les mé...