Une étude expérimentale sur l'exploration de transformateurs de vision légers robustes via un pré-entraînement par modélisation d'image masquée

Une étude expérimentale sur l’exploration de puissants transformateurs visuels légers via le pré-entraînement par modélisation d’image masquée Contexte académique Ces dernières années, l’apprentissage auto-supervisé (self-supervised learning, SSL) a fait des progrès significatifs dans le domaine de la vision par ordinateur. En particulier, la métho...