畳み込みカーネルの有効受容野の変更
GMConv:神経ネットワークの畳み込みカーネルの有効受容野の調整を実現 はじめに 畳み込みニューラルネットワーク(Convolutional Neural Networks、以下CNN)は、畳み込みカーネルの使用により画像分類や物体検出などのコンピュータービジョンタスクで顕著な成功を収めてきました。しかし、近年ではビジョントランスフォーマー(Vision Transformers、以下ViT)が注目を浴びており、これらは視覚認識タスクで優れた性能を発揮し、時にはCNNを超えることもあります。それにもかかわらず、CNNの改善に向けた取り組みは止まることなく、多くの研究が新しいCNNアーキテクチャの設計に取り組んでいます。特に大きな畳み込みカーネルを使用するCNNは、最新のViTに匹敵する性能...