疑似平面正則化符号付き距離場を用いたニューラル室内シーン再構築

疑似平面正則化符号距離場を用いたニューラル室内シーン再構築 学術的背景 室内シーンの3D再構築は、コンピュータグラフィックスや仮想現実など、幅広い応用が期待されるコンピュータビジョン分野の重要な課題です。従来の3D再構築手法は、高価な3Dグラウンドトゥルースデータに依存していましたが、近年、ニューラル放射場(NeRF)を用いた暗黙的なニューラル表現手法は、複数の画像のみを使用して優れた3D表面再構築能力を示しています。しかし、NeRFは主に色のボリュームレンダリングに基づいて最適化されるため、床や壁などの低テクスチャ領域での再構築品質が低いという問題があります。これらの低テクスチャ領域は室内シーンに広く存在し、通常は平面構造に対応しています。したがって、追加の監督信号を導入せず、部屋のレイア...

選択的周波数相互作用ネットワークによる航空物体検出の強化

無人機物体検出の向上を目指した選択的周波数領域相互ネットワーク 研究の背景と課題の提起 コンピュータビジョン技術の発展に伴い、無人機による物体検出はリモートセンシング分野における重要な研究テーマの1つになっています。無人機物体検出は、傾斜撮影や異なる高度で撮影された航空画像から、車両や建物などの物体を識別することを目的としています。この技術は、環境モニタリング、災害管理、安全監視などの分野で広く応用されています。しかしながら、物体のスケールや向き、複雑な背景に基づく課題により、無人機物体検出は以下のような多くの困難に直面しています: 物体の密集した分布 光条件に伴う変化 視点の変化 現在の多くの畳み込みニューラルネットワーク(Convolutional Neural Network, CNN...

StyleAdapter:統一されたスタイライズド画像生成モデル

StyleAdapter: 統一的なスタイル化画像生成モデル 近年、テキストから画像生成(Text-to-Image, T2I)技術および深層学習モデルの急速な発展により、人工知能による画像生成分野での研究が大きく進展しました。しかし、参照画像の特定のスタイルをテキスト生成された高品質画像に統合することは、いまだに大きな課題です。この課題に対応するため、Zhouxia Wangらは「StyleAdapter」と呼ばれる統一的なスタイル化画像生成モデルを提案しました。本論文は、International Journal of Computer Vision に発表され、香港大学、Tencent ARC Lab、マカオ大学、および上海人工知能研究所の研究者たちによって共同執筆されました。 研究背...