長尾画像認識における単純性バイアスの深掘り
学術的背景と問題提起 近年、深層ニューラルネットワークは、画像認識、物体検出、セマンティックセグメンテーションなどのコンピュータビジョン分野で顕著な進展を遂げています。しかし、長尾分布(long-tailed distribution)データに直面した場合、最も先進的な深層モデルでさえも性能が低下します。長尾分布とは、データセット内の少数クラス(tail classes)のサンプル数が多数クラス(head classes)のサンプル数に比べてはるかに少ない状況を指します。このデータ不均衡問題は、パイプライン故障検出や顔認識などの多くの実用的なアプリケーションで普遍的に見られます。 長尾画像認識の主な課題は、データ不均衡問題を効果的に処理し、特に少数クラスの汎化性能を向上させることです。一般的...