森林モニタリングにおける人工知能と地上点群の応用

人工知能と地上レーザースキャン点群データを用いた森林モニタリング:学術報告 学術的背景 地球規模の気候変動と森林資源管理の重要性が高まる中、精密林業(Precision Forestry)は現代の森林管理において重要な方向性となっています。精密林業は、高精度の森林データの収集と分析に依存しており、地上レーザースキャン(Terrestrial LiDAR, TLS)やモバイルレーザースキャン(Mobile LiDAR, MLS)技術の進歩により、森林モニタリングにこれまでにない詳細なデータが提供されるようになりました。しかし、これらの高密度な3次元点群データを処理することは依然として大きな課題であり、特に個々の木の分割、樹種分類、森林構造の分析などのタスクにおいて困難が生じています。 従来の手...

Delaunay三角分割を用いた3D形状表現の学習

Delaunay三角分割に基づく3D形状表現の学習 学術的背景 コンピュータビジョンとグラフィックスの分野において、点群データから表面を再構築することは長年の課題です。従来の暗黙的な方法(例:Poisson表面再構築)は、暗黙的な関数を計算し、Marching Cubesアルゴリズムを使用して表面を抽出します。これにより、水密(watertight)なメッシュを生成できますが、複雑な構造を扱う際には細部の喪失や過度の平滑化が発生しやすいです。一方、明示的な方法(例:Delaunay三角分割)は、点群の三角分割を直接行い、メッシュを構築します。これにより、鋭い特徴や細部をより良く保持できますが、複雑なトポロジーにおいて三角形の接続性を推測することは依然として困難です。 近年、学習ベースの手法が...

LDTrack: 拡散モデルを用いたサービスロボットによる動的人物追跡

拡散モデルを用いたサービスロボットによる動的人物追跡 学術的背景 複雑で混雑した人間中心の環境における動的人物の追跡は、ロボット技術における重要な課題です。特に、遮蔽、姿勢の変化、照明の変化などのクラス内変動が存在する場合、従来の追跡手法では正確な識別と追跡が困難です。既存のロボット追跡手法は、独立した検出と追跡システムに依存しており、計算効率とリアルタイム性の面で課題があります。特に、クラス内変動が大きい場合、検出器の失敗が追跡の中断を引き起こす可能性があります。 これらの問題を解決するため、本論文では、条件付き潜在拡散モデル(Conditional Latent Diffusion Models)に基づく新しいディープラーニングアーキテクチャ——潜在拡散追跡(Latent Diffusi...

CANet:コンテキストを考慮したマルチビューステレオネットワークによる効率的なエッジ保存深度推定

学術的背景と問題提起 多視点ステレオビジョン(Multi-View Stereo, MVS)は、3Dコンピュータビジョンの基本的なタスクであり、複数の視点からの画像からシーンの3Dジオメトリを復元することを目的としています。この技術は、ロボティクス、シーン理解、拡張現実などの分野で広く応用されています。近年、学習ベースのMVS手法は、粗から細かい深度推定フレームワークを採用することで大きな進歩を遂げています。しかし、既存の手法は、無テクスチャ領域、物体の境界、および薄い構造領域での深度復元に依然として困難を抱えています。主な理由としては、低テクスチャ領域でのマッチング手がかりの識別性の低さ、コストボリューム正則化に使用される3D畳み込みニューラルネットワーク(3D CNN)の本質的な平滑化特...

長尾画像認識における単純性バイアスの深掘り

学術的背景と問題提起 近年、深層ニューラルネットワークは、画像認識、物体検出、セマンティックセグメンテーションなどのコンピュータビジョン分野で顕著な進展を遂げています。しかし、長尾分布(long-tailed distribution)データに直面した場合、最も先進的な深層モデルでさえも性能が低下します。長尾分布とは、データセット内の少数クラス(tail classes)のサンプル数が多数クラス(head classes)のサンプル数に比べてはるかに少ない状況を指します。このデータ不均衡問題は、パイプライン故障検出や顔認識などの多くの実用的なアプリケーションで普遍的に見られます。 長尾画像認識の主な課題は、データ不均衡問題を効果的に処理し、特に少数クラスの汎化性能を向上させることです。一般的...

関係性に基づく多機能正則化を用いた連携半教師あり学習

学術的背景と問題提起 データプライバシーの問題がますます深刻化する中、連邦学習(Federated Learning, FL)は、分散型の機械学習パラダイムとして注目を集めています。連邦学習は、複数のクライアントがデータを共有することなく、協調してグローバルモデルを訓練することを可能にし、データプライバシーを保護します。しかし、既存の連邦学習手法は、各クライアントのデータが完全にラベル付けされていることを前提としていますが、これは実際のアプリケーションでは現実的ではありません。特に、ラベル付け能力が限られている場合には、この前提は成り立ちません。この問題を解決するために、連邦半教師あり学習(Federated Semi-Supervised Learning, FSSL)が提案されました。F...

ソースフリードメイン適応のためのクラスバランス型多中心動的プロトタイプ擬似ラベリング

学術的背景と問題提起 近年、深層学習モデル(Deep Neural Networks, DNNs)はコンピュータビジョンタスクにおいて顕著な成功を収めていますが、これらのモデルの訓練には大量の注釈付きデータが必要です。しかし、モデルが新しい未注釈のターゲット領域に適用される場合、領域差(domain shift)によりモデルの汎化能力が低下することがよくあります。この問題を解決するために、ドメイン適応(Domain Adaptation, DA)技術が登場しました。ドメイン適応の目標は、ソース領域の知識を活用して、ターゲット領域でのモデルのパフォーマンスを向上させることであり、特にターゲット領域に注釈データがない場合に有効です。 しかし、従来のドメイン適応手法は通常、ソース領域の生データにア...

半教師あり医療画像セグメンテーションのための予測とマスク

半監督医療画像セグメンテーションにおけるPICKモデルの応用 学術的背景 医療画像セグメンテーションは、臨床実践において重要な意義を持ち、医師に臓器や腫瘍の体積、位置、形状などの重要な情報を提供します。近年、深層学習に基づくモデルは医療画像セグメンテーションタスクで優れた性能を示していますが、これらのモデルは通常、大量の注釈付きデータを必要とします。しかし、医療画像の注釈は専門の臨床医師が必要であり、これらの注釈データを取得するには時間とコストがかかります。そのため、限られた注釈データでモデルの性能を向上させる方法が重要な研究課題となっています。 半教師あり学習(Semi-Supervised Learning, SSL)は、限られた注釈データと大量の未注釈データを同時に活用することで、この...

ロバストなシーケンシャルディープフェイク検出

学ロバストなシーケンシャルディープフェイク検出 学術的背景 深層生成モデル(GANなど)の急速な発展により、リアルな顔画像を生成することが非常に容易になりました。しかし、この技術の悪用は深刻なセキュリティ問題を引き起こしています。特に、ディープフェイク(Deepfake)技術は、偽の情報を拡散したり、偽のニュースを作成するために使用される可能性があります。この問題に対処するため、研究者たちはさまざまなディープフェイク検出手法を提案してきました。しかし、既存の手法は主に単一の顔操作を検出することに焦点を当てており、簡単に利用できる顔編集アプリケーションの普及により、人々は複数の操作を順番に行うことで顔を改ざんできるようになりました。この新しい脅威に対処するため、一連の顔操作を検出することが重要...

セマンティック協調学習を用いたヒューリスティック水中知覚強化

学術的背景と問題提起 水中画像は、海洋探査、水中ロボット、海洋生物識別などの分野で重要な応用価値を持っています。しかし、水による光の屈折と吸収の影響で、水中画像は通常、コントラストが低く、色の歪みが生じるため、後続の知覚タスク(例えば、物体検出やセマンティックセグメンテーションなど)の精度に深刻な影響を与えます。既存の水中画像強調方法は主に視覚品質の向上に焦点を当てていますが、強調画像の実際の応用効果を無視しています。そのため、視覚品質の向上と実際の応用のバランスを取ることが、現在の研究における重要な課題となっています。 この問題を解決するために、本論文では、ヒューリスティックな可逆ネットワークに基づく水中知覚強調方法(HUPE)を提案しています。この方法は、水中画像の視覚品質を向上させるだ...