DRTN : Réseau de transformateurs à double relation avec effacement de caractéristiques et apprentissage contrastif pour la classification d'images multi-étiquettes

Nouvelle avancée dans la classification d’images multi-étiquettes : le réseau Transformer à double relation Contexte académique La classification d’images multi-étiquettes (Multi-Label Image Classification, MLIC) est un problème fondamental mais très complexe dans le domaine de la vision par ordinateur. Contrairement à la classification d’images à ...