汎用代理モデルを用いたサンプル選択によるラベルノイズの対処

学術的背景と問題提起 ディープニューラルネットワーク(Deep Neural Networks, DNNs)の急速な発展に伴い、視覚知能システムは画像分類、物体検出、動画理解などのタスクで顕著な進歩を遂げています。しかし、これらのブレークスルーは高品質な注釈付きデータの収集に依存しており、注釈プロセスは時間がかかり、コストがかかります。この問題に対処するため、研究者は大規模なウェブデータを活用してトレーニングを行うようになりましたが、これらのデータにはノイズラベル(label noise)が含まれることが多く、これがディープニューラルネットワークの性能に悪影響を及ぼします。ノイズラベルの存在は、トレーニングデータとテストデータの分布の不一致を引き起こし、クリーンなテストデータに対するモデルの...

行動から自然言語へ:無人航空機意図認識の生成アプローチ

UAVの行動意図認識の生成モデルに基づく研究:行動から自然言語へのクロスモーダルアプローチ 背景と研究目的 近年、無人機(Unmanned Aerial Vehicle, UAV)技術は飛躍的な発展を遂げ、捜索救助、農業精密作業、通信中継などの民間および軍事分野で広く活用されています。しかし、UAV群の規模が拡大し、知能化レベルが向上する中、空中指揮と制御分野における更なる高度な知能化への需要が高まっています。複雑な対抗環境下では「状況認識」(Situation Awareness)を向上することが鍵となり、特にUAVの行動意図を効果的に識別することが重要です。この識別プロセスは、敵の作戦意図と戦術的欺瞞の関係を明らかにし、指揮体系内での情報フローを最適化し、意思決定に対するガイドラインを提...

選択的周波数相互作用ネットワークによる航空物体検出の強化

無人機物体検出の向上を目指した選択的周波数領域相互ネットワーク 研究の背景と課題の提起 コンピュータビジョン技術の発展に伴い、無人機による物体検出はリモートセンシング分野における重要な研究テーマの1つになっています。無人機物体検出は、傾斜撮影や異なる高度で撮影された航空画像から、車両や建物などの物体を識別することを目的としています。この技術は、環境モニタリング、災害管理、安全監視などの分野で広く応用されています。しかしながら、物体のスケールや向き、複雑な背景に基づく課題により、無人機物体検出は以下のような多くの困難に直面しています: 物体の密集した分布 光条件に伴う変化 視点の変化 現在の多くの畳み込みニューラルネットワーク(Convolutional Neural Network, CNN...

拡散モデルに基づく特徴増強を用いた全スライド画像における多インスタンス学習

拡散モデルに基づく特徴拡張:全視野病理画像における多数例学習の新手法 学術的背景と研究の動機 計算病理学(computational pathology)の分野では、全視野スライド画像(Whole Slide Images, WSIs)の効果的な分析方法が現在の研究課題として注目されています。WSIsは超高解像度の画像であり、広範囲な視野を持ち、がん診断に広く利用されています。しかし、ラベル付きデータの不足や巨大な画像データがもつ計算負荷の問題から、WSIの自動解析における深層学習手法、特に多数例学習(Multiple Instance Learning, MIL)には多くの課題があります。 MILは典型的な弱教師あり学習手法であり、WSI全体を「バッグ」に見立て、その中の小領域(パッチ)を...

単一トランスデューサーに基づくウェアラブルエコー筋電図システム

ウェアラブル単一トランスデューサーによるエコーマイオグラフィーシステムの革新:筋肉動態監視から複雑なジェスチャー追跡まで 学術的背景と研究の意義 近年では、ウェアラブル電子デバイスが健康モニタリングおよびヒューマンマシンインタラクション分野において大きな可能性を持つとして注目を集めています。その中でも、筋活動を測定する技術として表面筋電図(Electromyography, EMG)が研究のホットトピックとなっています。しかし、EMG信号には多くの制約があります。信号強度が弱く不安定で、空間分解能が低い上、信号対雑音比(SNR)が低いです。その偶発性や同期性の低さが測定結果の不一致につながり、特定の筋線維の寄与を効果的に分離することが困難です。また、信号質を改善するために利用される大型の電極...

英国の乳がんスクリーニングコホートにおける深層学習アルゴリズム:独立した読影と人間の読影との組み合わせ

乳がんスクリーニングにおける深層学習アルゴリズムの応用 学術的背景 乳がんは世界中の女性において最も一般的ながんの一つであり、早期スクリーニングは治癒率の向上に不可欠です。従来のコンピュータ支援検出(Computer-Aided Detection, CAD)システムは、特に米国においてマンモグラフィースクリーニングで広く使用されてきました。しかし、これらのシステムはリコール率を向上させる一方で、読影者(放射線科医)のパフォーマンス改善には限定的な効果しかありませんでした。近年、深層学習(Deep Learning, DL)アルゴリズムの医療画像解析への応用が急速に進んでおり、特に乳がんスクリーニング分野で注目されています。複数のシステマティックレビューとメタアナリシスによると、2017年以...

CellMincerを使用した電圧イメージングデータのロバストな自己教師付きノイズ除去

学術的背景 電圧イメージング(voltage imaging)は、神経活動を研究するための強力な技術ですが、その有効性は低い信号対雑音比(SNR)によって制限されることが多いです。従来のノイズ除去方法、例えば行列分解は、ノイズと信号構造について厳密な仮定を課しますが、既存の深層学習アプローチは、電圧イメージングデータに固有の高速なダイナミクスと複雑な依存関係を完全に捉えることができませんでした。これらの問題を解決するために、本論文ではCellMincerという新しい自己教師あり深層学習手法を提案し、電圧イメージングデータセットのノイズ除去に特化しています。CellMincerは、短時間ウィンドウ内のスパースなピクセルセットをマスクして予測し、事前計算された時空間自己相関を組み合わせることで、...

溶液中のRNase P RNAの構造空間

RNAのコンフォメーション空間の研究:溶液中のRNase P RNAの動的構造 学術的背景 RNAのコンフォメーション多様性は、生物学において重要な役割を果たしており、特にRNAスプライシング、パッケージング、細胞転写活性化、および環境刺激応答などのプロセスにおいて重要です。しかし、従来の生物物理学的技術では、溶液中のRNAの完全なコンフォメーション空間を直接可視化することはできませんでした。RNase P RNAは、すべての生物界に存在するRNA酵素であり、前駆体tRNA(pre-tRNA)の5’末端を編集する役割を担っています。その基質特異性が広範であることから、RNase P RNAは高いコンフォメーション柔軟性を持つと考えられており、この柔軟性と酵素活性に必要な剛性構造との間には複雑...

人物再識別のための動的注意ビジョン・言語トランスフォーマーネットワーク

動的注意機構を持つ視覚言語Transformerネットワークを用いた歩行者再識別に関する研究報告 近年、マルチモーダルベースの歩行者再識別(Person Re-Identification、以下ReID)はコンピュータビジョンの分野で注目を集めています。ReIDは、異なるカメラの視点間で特定の歩行者を識別することを目的としており、行方不明者の捜索や犯罪者の追跡といったセキュリティ・監視アプリケーションにおいて重要な役割を果たします。しかし、マルチモーダルReID技術では、視覚情報とテキスト情報を統合する際に大きな課題が存在し、特に特徴統合の偏りや、モデル性能に影響を与えるドメインギャップ(分布の違い)が問題となっています。 本研究は、江西財経大学コンピュータと人工知能学院およびニューカッスル...

バイオメトリクスデータの誤り訂正のための現代的な深層学習技術の再考

現代のディープラーニング技術における生体データのエラー訂正に関する再考 背景 情報技術の発展に伴い、生体データは認証や安全なデータ保管のための重要な要素として利用されています。従来の暗号技術は、均一分布で再現可能なランダム文字列に依存していましたが、指紋や虹彩スキャンのような生体データはそのような特性を備えておらず、生成・保管・取得に課題を抱えています。こうした課題に対処するため、生体データを暗号鍵の生成元として利用する生体認証暗号システム(biometric cryptosystems)が注目されています。しかし、生体データの変動性や外部要因(センサーのノイズなど)により、暗号鍵の正確な復元が困難となり、エラー訂正メカニズムが重要となります。 近年、ディープラーニング(DL)の進展により、...