効率的なテンソル分解に基づくフィルタプルーニング
背景介紹 ネットワークプルーニング(Network Pruning)は、効率的な畳み込みニューラルネットワーク(CNNs)モデルを設計するための重要な技術です。メモリ使用量と計算要求を削減しつつ、全体的なパフォーマンスを維持または向上させることで、リソース制限のあるデバイス(携帯電話や組み込みシステムなど)でのCNNsの展開が実現可能になります。現在の仮定は、多くのモデルパラメータが過剰であり、大量の不必要または冗長なパラメータを含んでいるというもので、これらの冗長パラメータを削除することで、より小さくて効率的なモデルを生成できます。これはリソース制限のあるデバイスにだけでなく、場合によってはモデルの汎化能力を向上させることもあります。 既存のプルーニング手法の中で、フィルタープルーニング(...