適応的に適切でない領域を特定および改善して正確なステレオマッチングを実現する

適応的に適切でない領域を特定および改善して正確なステレオマッチングを実現する

不良領域を適応的に識別および最適化して正確なステレオマッチングを実現 研究の背景と動機 コンピュータービジョン技術の急速な発展に伴い、ステレオマッチング技術はその高い精度、コスト効率、および非侵入性から、ロボティクス、宇宙、自動運転、産業製造など多くの分野で重要な役割を果たしています。しかし、オクルージョン領域やぼやけた領域を処理する際、ピクセル間の一致制約が信頼できなくなり、対応関係の探索が困難になります。そのため、畳み込みニューラルネットワーク(CNN)やトランスフォーマーベースの研究が急速に進展しているにもかかわらず、多くの方法が不良領域の処理において性能のボトルネックに直面しています。この課題に対処するため、研究チームはエラー領域特徴最適化メカニズムを導入して文脈特徴を提供し、不良領...

非独立同分布データを用いた多中心疾患診断のためのモデル投影による連合学習

非独立同分布データを用いた多中心疾患診断のためのモデル投影による連合学習

モデルプロジェクションを使用したフェデレーテッドラーニングによる多センター疾病診断 背景紹介 医療画像技術の急速な発展に伴い、自動化診断方法の研究は単一センターデータセットで良好な性能を示しています。しかし、これらの方法は実際の応用では他の医療機関のデータに一般化しにくいことが多いです。主な理由は、これらの方法が異なる医療センターのデータを独立同分布(IID)と仮定しているが、実際には異なるセンターが異なるスキャナーや画像パラメータを使用しているため、データ分布が非独立同分布(Non-IID)であることです。さらに、異なるセンターで診断される患者の数や種類にも大きな差があります。したがって、多センターのデータは異質性を持ち、集中化学習(Centralized Learning)では効果的に解...

制約付き非ゼロ和ゲームのための適応サンプリング人工-実際制御

制約システムの非ゼロ和ゲームにおける適応サンプリング人工・実際制御の応用 背景 現代の工業および研究分野におけるスマート技術と制御システムの急速な発展により、従来の制御方法がシステムの安定性を保証し、エネルギー消費を最小化するという厳しい要求を満たすことが困難になっています。実際のシステムは通常非常に複雑で、少なくとも2つの制御ユニットを含んでおり、コンポーネント間には複雑な競争と協力の関係があります。このような状況では、設計された制御スキームは単一のコントローラーの利益最大化だけでなく、全体の最適化も実現する必要があります。このような問題は通常、非ゼロ和ゲーム(Non-Zero-Sum Games,NZSG)とみなされ、多物理入力の制約条件下でシステムのカップリングダイナミクスを処理するこ...

テキスト認識型クロスモーダルコントラストデザンタングリングによるマルチグレインビジュアルピボットガイドのマルチモーダルニューラルマシントランスレーション

テキスト認識型クロスモーダルコントラストデザンタングリングによるマルチグレインビジュアルピボットガイドのマルチモーダルニューラルマシントランスレーション

多尺度視覚中枢ガイドの多モーダル神経機械翻訳:テキスト認識のクロスモーダル対比デカップリング 学術背景 多モーダル神経機械翻訳(Multi-Modal Neural Machine Translation, MNMT)は、言語に依存しない視覚情報をテキストに導入して機械翻訳の性能を向上させることを目指しています。しかし、画像とテキストはモーダル間で顕著な差異があるため、両者間では避けられない意味の不一致が発生します。これらの問題を解決するための目標は、分解された多尺度視覚情報をクロスランゲージ中枢として使用することにより、異なる言語間のアライメントを向上させ、MNMTのパフォーマンスを改善することです。 論文情報 この論文は朱俊俊、蘇瑞および葉俊杰などの研究者によって執筆され、著者はそれぞれ...

自律型ドローンのための完全ニューロモルフィックビジョンおよび制御

自律型ドローンのための完全ニューロモルフィックビジョンおよび制御

完全なニューロモルフィックビジョンとコントロールを持つ自律飛行体 背景と研究動機 過去10年間で、ディープニューラルネットワーク(ANNs)は人工知能分野で大きな進展を遂げ、とりわけ視覚処理において顕著な成果を上げました。しかし、これらの高度な視覚処理技術は高精度を実現する一方で、多大な計算リソースとエネルギーを消費するため、小型飛行ロボットなどリソースが限られた場合には応用が難しいです。 この問題に対処するために、ニューロモルフィックハードウェアは生物の脳のスパースで非同期的な特性を模倣することで、より効率的な認識と処理能力を実現しました。ロボット分野では、ニューロモルフィックハードウェアに含まれるイベント駆動カメラとスパイキングニューラルネットワーク(SNNs)が低遅延・低エネルギー消費...

深層強化学習による二足歩行ロボットの敏捷なサッカースキルの学習

深層強化学習による二足歩行ロボットの敏捷なサッカースキルの学習

深層強化学習で二足ロボットに敏捷なサッカースキルを付与 背景説明 エージェントが物理世界で敏捷性、柔軟性、理解力を示すことは、人工知能(Artificial Intelligence, AI)研究の長年の目標の一つです。しかし、動物や人間は複雑な身体の動きを流暢にこなすだけでなく、環境を感知し理解し、身体を使って世界で複雑な目標を達成することができます。歴史的に、複雑な運動能力を持つ知的な身体エージェントを作ろうとする試みは長く続いており、それはシミュレーション環境でも現実の環境でも同様です。近年の技術の急速な進歩、特に学習に基づく方法論の進展により、深層強化学習(Deep Reinforcement Learning, Deep RL)が、シミュレーションキャラクターでも物理ロボットでも、...

車輪付き脚ロボットのための堅牢な自律ナビゲーションと移動学習

車輪付き脚ロボットのための堅牢な自律ナビゲーションと移動学習

自律的に移動できる車輪脚ロボット 背景紹介 都市化の進展に伴い、サプライチェーン物流、特にラストワンマイルの配送が大きな課題となっています。交通の混雑が増加し、より迅速な配送サービスが求められる中、特に屋内や街路での複雑なルートは配送にとって解決し難い問題となっています。従来の車輪型ロボットは複雑な障害物を越えるのが難しく、脚部システムだけでは必要な速度と効率を達成することはできません。例えば、ANYmalロボットは一定の移動能力を持っているものの、その最大走行速度は平均的な歩行速度の半分に過ぎず、バッテリーの持続時間も限られています。したがって、平坦な地面で効率的に動き、障害物を乗り越えることができるロボットシステムを開発することが研究の主要な方向となっています。 本稿で主要に研究している...

三次元空間における時空間認識のための立体人工集眼

三次元空間における時空間認識のための立体人工集眼

立体人工复眼用于三维空间的时空感知 本研究文章发表在2024年5月15日的《Science Robotics》期刊上,题为“立体人工复眼用于三维空间的时空感知(Stereoscopic Artificial Compound Eyes for Spatiotemporal Perception in Three-Dimensional Space)”,第一作者为Byungjoon Bae,指导作者为Kyusang Lee。研究团队主要来自University of Virginia的电气与计算机工程系和材料科学与工程系。 研究背景 在自然界中,节肢动物(arthropods)的复眼是非常有效的生物视觉系统,具备广阔的视野(Field of View, FOV)和高运动敏感度,而祷蛾(mant...

強化学習による現実世界のヒューマノイドロコモーション

強化学習による現実世界のヒューマノイドロコモーション

強化学習に基づく現実世界でのヒューマノイドロボットの歩行 背景紹介 ヒューマノイドロボットは多様な環境で自主的に作業する潜在力を持ち、工場での労働力不足を緩和し、在宅老人を支援し、新しい惑星の開拓にも寄与することが期待されています。従来のコントローラーは特定のシナリオで優れたパフォーマンスを示していますが、新しい環境への適応性には依然として課題があります。そこで、本論文では完全に学習に基づく方法を提案し、現実世界におけるヒューマノイドロボットの運動制御を実現します。 研究動機 従来の制御方法は安定したロバストな運動制御の実現において大きな進展が見られますが、その適応性と汎用性には限界があります。一方で、学習に基づく方法は多様なシミュレーションまたは実環境から学習することができ、徐々に注目を集...

半球形ナノワイヤーアレイを使用した超広視野ピンホール複眼ロボットビジョン

半球形ナノワイヤーアレイを使用した超広視野ピンホール複眼ロボットビジョン

ロボットビジョン用半球状ナノワイヤアレイに基づく超広視野ピンホール複眼 現代の人工知能とロボット技術の急速な発展において、視覚システムはその中で重要な要素として広く注目され、深く研究されています。Zhouらが2024年5月15日に『Science Robotics』で発表した研究論文によると、彼らは生物の複眼デザインに基づく新しい人工視覚システムを提案しました。このシステムは3Dプリントされたハニカム構造と半球形ペロブスカイトナノワイヤ光電検出アレイを組み合わせることで、超広視野、精密なターゲット定位および運動追跡機能を実現しました。本稿ではこの研究の背景、方法、結果および意義を全面的に解析しています。 研究背景 生物の進化は自然界における様々な視覚システムに卓越した視覚能力を付与しました。...