関係性に基づく多機能正則化を用いた連携半教師あり学習

学術的背景と問題提起 データプライバシーの問題がますます深刻化する中、連邦学習(Federated Learning, FL)は、分散型の機械学習パラダイムとして注目を集めています。連邦学習は、複数のクライアントがデータを共有することなく、協調してグローバルモデルを訓練することを可能にし、データプライバシーを保護します。しかし、既存の連邦学習手法は、各クライアントのデータが完全にラベル付けされていることを前提としていますが、これは実際のアプリケーションでは現実的ではありません。特に、ラベル付け能力が限られている場合には、この前提は成り立ちません。この問題を解決するために、連邦半教師あり学習(Federated Semi-Supervised Learning, FSSL)が提案されました。F...

ソースフリードメイン適応のためのクラスバランス型多中心動的プロトタイプ擬似ラベリング

学術的背景と問題提起 近年、深層学習モデル(Deep Neural Networks, DNNs)はコンピュータビジョンタスクにおいて顕著な成功を収めていますが、これらのモデルの訓練には大量の注釈付きデータが必要です。しかし、モデルが新しい未注釈のターゲット領域に適用される場合、領域差(domain shift)によりモデルの汎化能力が低下することがよくあります。この問題を解決するために、ドメイン適応(Domain Adaptation, DA)技術が登場しました。ドメイン適応の目標は、ソース領域の知識を活用して、ターゲット領域でのモデルのパフォーマンスを向上させることであり、特にターゲット領域に注釈データがない場合に有効です。 しかし、従来のドメイン適応手法は通常、ソース領域の生データにア...

半教師あり医療画像セグメンテーションのための予測とマスク

半監督医療画像セグメンテーションにおけるPICKモデルの応用 学術的背景 医療画像セグメンテーションは、臨床実践において重要な意義を持ち、医師に臓器や腫瘍の体積、位置、形状などの重要な情報を提供します。近年、深層学習に基づくモデルは医療画像セグメンテーションタスクで優れた性能を示していますが、これらのモデルは通常、大量の注釈付きデータを必要とします。しかし、医療画像の注釈は専門の臨床医師が必要であり、これらの注釈データを取得するには時間とコストがかかります。そのため、限られた注釈データでモデルの性能を向上させる方法が重要な研究課題となっています。 半教師あり学習(Semi-Supervised Learning, SSL)は、限られた注釈データと大量の未注釈データを同時に活用することで、この...

ロバストなシーケンシャルディープフェイク検出

学ロバストなシーケンシャルディープフェイク検出 学術的背景 深層生成モデル(GANなど)の急速な発展により、リアルな顔画像を生成することが非常に容易になりました。しかし、この技術の悪用は深刻なセキュリティ問題を引き起こしています。特に、ディープフェイク(Deepfake)技術は、偽の情報を拡散したり、偽のニュースを作成するために使用される可能性があります。この問題に対処するため、研究者たちはさまざまなディープフェイク検出手法を提案してきました。しかし、既存の手法は主に単一の顔操作を検出することに焦点を当てており、簡単に利用できる顔編集アプリケーションの普及により、人々は複数の操作を順番に行うことで顔を改ざんできるようになりました。この新しい脅威に対処するため、一連の顔操作を検出することが重要...

セマンティック協調学習を用いたヒューリスティック水中知覚強化

学術的背景と問題提起 水中画像は、海洋探査、水中ロボット、海洋生物識別などの分野で重要な応用価値を持っています。しかし、水による光の屈折と吸収の影響で、水中画像は通常、コントラストが低く、色の歪みが生じるため、後続の知覚タスク(例えば、物体検出やセマンティックセグメンテーションなど)の精度に深刻な影響を与えます。既存の水中画像強調方法は主に視覚品質の向上に焦点を当てていますが、強調画像の実際の応用効果を無視しています。そのため、視覚品質の向上と実際の応用のバランスを取ることが、現在の研究における重要な課題となっています。 この問題を解決するために、本論文では、ヒューリスティックな可逆ネットワークに基づく水中知覚強調方法(HUPE)を提案しています。この方法は、水中画像の視覚品質を向上させるだ...

品質敵対学習によるブラインド画像品質評価:内容忠実度の知覚可能性の探求

品質敵対学習を用いたコンテンツ忠実度を探求するブラインド画像品質評価 学術的背景 画像品質評価(Image Quality Assessment, IQA)は、コンピュータビジョン分野における基本的な問題であり、画像の視覚的内容の忠実度を評価することを目的としています。IQAは、画像圧縮や復元などの分野で重要な応用価値を持っています。従来のIQA手法は、主にフルリファレンス(Full-Reference, FR-IQA)とノーリファレンス(No-Reference, NR-IQA)の2つに分類されます。FR-IQAは、歪み画像と参照画像との差異を比較することで画像品質を評価しますが、NR-IQAは参照画像なしで歪み画像自体から品質を評価します。NR-IQAは参照画像を必要としないため、画像内...

境界回帰と構造的再パラメータ化に基づく核インスタンスセグメンテーションモデルRepsNet

境界回帰と構造的再パラメータ化に基づく核インスタンスセグメンテーションモデルRepsNet

境界回帰と構造再パラメータ化に基づく核インスタンスセグメンテーションモデルRepsNet 学術的背景 病理診断は腫瘍診断のゴールドスタンダードであり、核インスタンスセグメンテーションはデジタル病理分析と病理診断における重要なステップです。しかし、モデルの計算効率と重複ターゲットの処理は、現在の研究における主要な課題です。これらの問題を解決するために、本論文では、核境界回帰と構造再パラメータ化に基づくニューラルネットワークモデルRepsNetを提案し、H&E染色された組織病理学画像における核のセグメンテーションと分類を行います。 核の分布と形態的特徴(密度、核質比、平均サイズ、多形性など)は、がんのグレード評価だけでなく、治療効果の予測にも有用です。しかし、病理画像は通常、核の広範な接着、多様...

CSFRNet: 長期人物再識別のための服装状態認識の統合

概要 長期人物再識別(LT-ReID)における服装の変化に対応するため、従来の手法から離れる必要があります。従来のLT-ReID戦略は、主に生体認証ベースとデータ適応ベースの2つに分かれていますが、それぞれに欠点があります。前者は高品質な生体データが不足する環境では機能せず、後者は服装の変化が最小または微妙な場合に効果を失います。これらの課題を克服するため、我々は服装状態認識特徴正則化ネットワーク(CSFRNet)を提案します。この新しいアプローチは、服装状態認識を特徴学習プロセスにシームレスに統合し、服装が完全に変化する場合、部分的に変化する場合、または全く変化しない場合においても、明示的な服装ラベルを必要とせずにLT-ReIDシステムの適応性と精度を大幅に向上させます。我々のCSFRNe...

疑似平面正則化符号付き距離場を用いたニューラル室内シーン再構築

疑似平面正則化符号距離場を用いたニューラル室内シーン再構築 学術的背景 室内シーンの3D再構築は、コンピュータグラフィックスや仮想現実など、幅広い応用が期待されるコンピュータビジョン分野の重要な課題です。従来の3D再構築手法は、高価な3Dグラウンドトゥルースデータに依存していましたが、近年、ニューラル放射場(NeRF)を用いた暗黙的なニューラル表現手法は、複数の画像のみを使用して優れた3D表面再構築能力を示しています。しかし、NeRFは主に色のボリュームレンダリングに基づいて最適化されるため、床や壁などの低テクスチャ領域での再構築品質が低いという問題があります。これらの低テクスチャ領域は室内シーンに広く存在し、通常は平面構造に対応しています。したがって、追加の監督信号を導入せず、部屋のレイア...

AutoStory:最小限の人的努力で多様なストーリーテリング画像を生成する

AutoStory:最小限の人的努力で多様なストーリーテリング画像を生成する

学術的背景と問題提起 ストーリービジュアライゼーション(Story Visualization)は、テキストで記述されたストーリーから一連の視覚的に一貫した画像を生成することを目的としたタスクです。このタスクでは、生成された画像が高品質であるだけでなく、テキストの記述と一致し、異なる画像間でキャラクターのアイデンティティやシーンが一貫している必要があります。ストーリービジュアライゼーションは、芸術創作、児童教育、文化継承などの分野で幅広い応用が期待されていますが、その複雑さから、既存の手法は特定のキャラクターやシーンのみを考慮したり、ユーザーに画像ごとの制御条件(スケッチなど)を提供することを要求したりすることで問題を大幅に簡略化しています。これらの簡略化により、既存の手法は実際のアプリケー...