CANet:コンテキストを考慮したマルチビューステレオネットワークによる効率的なエッジ保存深度推定
学術的背景と問題提起 多視点ステレオビジョン(Multi-View Stereo, MVS)は、3Dコンピュータビジョンの基本的なタスクであり、複数の視点からの画像からシーンの3Dジオメトリを復元することを目的としています。この技術は、ロボティクス、シーン理解、拡張現実などの分野で広く応用されています。近年、学習ベースのMVS手法は、粗から細かい深度推定フレームワークを採用することで大きな進歩を遂げています。しかし、既存の手法は、無テクスチャ領域、物体の境界、および薄い構造領域での深度復元に依然として困難を抱えています。主な理由としては、低テクスチャ領域でのマッチング手がかりの識別性の低さ、コストボリューム正則化に使用される3D畳み込みニューラルネットワーク(3D CNN)の本質的な平滑化特...