特徴消去と対照学習を組み合わせた二重関係Transformerネットワークを用いた多ラベル画像分類
多ラベル画像分類の新たなブレークスルー——デュアルリレーショントランスフォーマーネットワーク 学術的背景 多ラベル画像分類(Multi-Label Image Classification, MLIC)は、コンピュータビジョン分野における基礎的でありながら非常に挑戦的な問題です。単一ラベル画像分類とは異なり、MLICの目標は、1枚の画像内の複数のオブジェクトに同時にラベルを割り当てることです。画像内には複数のオブジェクトが含まれる可能性があり、これらのオブジェクト間には複雑な空間的および意味的関係が存在するため、MLICタスクはシーンの複雑さ、オブジェクトのスケールの多様性、およびオブジェクト間の暗黙の関連性といった課題に直面しています。近年、深層学習技術の急速な発展、特に畳み込みニューラル...