SP-DTI:サブポケット情報を利用したTransformerモデルによる薬物-標的相互作用予測

学術的背景 薬物-ターゲット相互作用(Drug-Target Interaction, DTI)の予測は、薬物発見における重要なプロセスであり、実験スクリーニングのコストと時間を大幅に削減することができます。しかし、深層学習技術がDTI予測の精度を向上させたにもかかわらず、既存の方法は依然として2つの大きな課題に直面しています:汎化能力の不足とサブポケットレベルの相互作用の無視です。まず、既存のモデルは未知のタンパク質やクロスドメイン設定において性能が著しく低下します。次に、現在の分子関係学習は、サブポケットレベルの相互作用をしばしば無視しており、これらの相互作用は結合部位の詳細を理解する上で重要です。これらの課題を解決するために、研究者はSP-DTIという新しいモデルを提案し、サブポケット...

反事実的推論を用いた多モーダル公衆スピーチ不安検出のための一般的なデビアスフレームワーク

学術的背景と問題の導入 現代の教育分野において、パブリックスピーキング不安(Public Speaking Anxiety, PSA)は、特に非母語話者の間で広く見られる現象です。この不安は学習者の表現力を妨げるだけでなく、個人の成長を阻害する可能性もあります。この問題を解決するために、研究者たちはビデオ、音声、テキストなどのマルチモーダルデータを用いてスピーチ不安状態を自動的に検出する方法を探求し始めています。しかし、既存のマルチモーダルパブリックスピーキング不安検出(Multimodal Public Speaking Anxiety Detection, MPSAD)モデルは、トレーニングプロセス中にコンテキストバイアス(context bias)、ラベルバイアス(label bias...

デュアルプロンプトを用いたリハーサルベースの継続学習

学術的背景 機械学習とニューラルネットワークの分野において、継続学習(Continual Learning)は重要な研究テーマです。継続学習の目標は、モデルが一連のタスクにおいて新たな知識を継続的に学習しつつ、既に学習した古い知識を忘れないようにすることです。しかし、既存の継続学習手法は主にカタストロフィックフォゲッティング(Catastrophic Forgetting)という課題に直面しています。カタストロフィックフォゲッティングとは、モデルが新しいタスクを学習する際に、以前に学習した知識を急速に忘れてしまい、古いタスクの性能が大幅に低下する現象です。この問題は現実のアプリケーションにおいて特に深刻で、多くのタスクが変化する環境下で継続的に学習し適応する必要があるためです。 この問題を解...

基準点付き複数量子化最小誤差エントロピー:理論とモデル回帰への応用

複数量子化最小誤差エントロピーと基準点の理論及び応用:モデル回帰における突破 学術的背景 機械学習と信号処理の分野において、非ガウスノイズの存在はモデルの性能に不利な影響を与えることが多い。伝統的な平均二乗誤差(Mean Squared Error, MSE)は理論的および計算的に単純であるが、非ガウスノイズに対してはその信頼性が大きく低下する。この問題を解決するため、研究者たちは様々な最適化基準を提案しており、その中でも最小誤差エントロピー(Minimum Error Entropy, MEE)は、インパルスノイズや外れ値の抑制における優れた性能から注目を集めている。しかし、元のMEEアルゴリズムは誤差サンプルの二重和を必要とするため、計算複雑度が高く、大規模データセットへの応用が制限され...

特徴消去と対照学習を組み合わせた二重関係Transformerネットワークを用いた多ラベル画像分類

多ラベル画像分類の新たなブレークスルー——デュアルリレーショントランスフォーマーネットワーク 学術的背景 多ラベル画像分類(Multi-Label Image Classification, MLIC)は、コンピュータビジョン分野における基礎的でありながら非常に挑戦的な問題です。単一ラベル画像分類とは異なり、MLICの目標は、1枚の画像内の複数のオブジェクトに同時にラベルを割り当てることです。画像内には複数のオブジェクトが含まれる可能性があり、これらのオブジェクト間には複雑な空間的および意味的関係が存在するため、MLICタスクはシーンの複雑さ、オブジェクトのスケールの多様性、およびオブジェクト間の暗黙の関連性といった課題に直面しています。近年、深層学習技術の急速な発展、特に畳み込みニューラル...

モバイルアドホックネットワークにおける効率的な画像認識のための適応型分散マルチタスク学習

適応分散型マルチタスク学習フレームワークADAMT:モバイルアドホックネットワークにおける効率的な画像認識 学術的背景 モバイルアドホックネットワーク(Mobile Ad-hoc Networks, MANETs)において、分散型機械学習は大きな課題に直面しています。これらの課題は、デバイスの限られた計算リソース、非独立同分布(Non-IID)のデータ分布、そして動的に変化するネットワークトポロジーに起因しています。既存の手法は、中央集権的な調整と安定したネットワーク条件に依存することが多いですが、実際のアプリケーションではこれらの条件を満たすことが難しい場合があります。これらの問題を解決するために、研究者たちはADAMT(Adaptive Distributed Multi-Task Le...

エピソードメモリダブルアクタークリティックツインディレイドディープデターミニスティックポリシーグラディエント

学術的背景 深層強化学習(Deep Reinforcement Learning, DRL)は、ゲーム、ロボット、ナビゲーション、コンピュータビジョン、金融など、さまざまな分野で顕著な成果を上げています。しかし、既存のDRLアルゴリズムは、一般的にサンプル効率が低いという問題を抱えています。つまり、理想的な性能を達成するためには、大量のデータとトレーニングステップが必要です。特に連続動作タスクでは、状態-アクション空間の高次元性により、従来のDRLアルゴリズムはエピソード記憶(Episodic Memory)を効果的に活用してアクション選択を導くことが難しく、サンプル効率がさらに低下します。 エピソード記憶は、非パラメトリック制御手法の一つであり、高報酬の履歴経験を記憶することでサンプル効率...

監視ビデオにおける異常行動検出のための確率的メモリオートエンコーディングネットワーク

監視ビデオにおける異常行動検出のための確率的メモリオートエンコーディングネットワーク

確率メモリオートエンコーディングネットワークを用いた監視カメラ映像の異常行動検出研究 学術的背景 インテリジェント監視システムにおいて、異常行動検出は、テロ対策、社会の安定維持、公共の安全確保など、極めて重要な機能です。しかし、異常行動検出には核心的な課題があります。それは、通常の行動データと異常行動データの極端な不均衡です。通常の行動データは大量に入手可能ですが、異常行動データは少なく、予測が困難です。この不均衡により、従来の教師あり学習手法では効果的なモデルの訓練が難しくなっています。そのため、大量の通常行動データを活用して通常行動の分布をモデル化し、それに基づいて異常行動を検出する方法の研究が重要な方向性となっています。 近年、深層学習に基づく手法が異常行動検出において顕著な進展を遂げ...

制限付きボルツマンマシンにおけるデータセットフリーの重み初期化

統計力学的分析に基づく制限付きボルツマンマシンの重み初期化手法の研究 学術的背景 深層学習において、ニューラルネットワークの重み初期化はモデルの学習効果に大きな影響を与えます。特に、フィードフォワードニューラルネットワーク(feed-forward neural networks)では、LeCun、Xavier(またはGlorot)、He初期化など、データセットに依存しない重み初期化手法が提案されています。これらの手法は、特定の分布(例えばガウス分布や一様分布)に基づいて重みパラメータの初期値をランダムに決定し、トレーニングデータセットを使用しません。しかし、制限付きボルツマンマシン(Restricted Boltzmann Machine, RBM)では、同様の重み初期化手法はまだ開発され...

視覚と言語の統合によるゼロショット人-物相互作用検出に向けて

視覚と言語の統合によるゼロショット人-物相互作用検出に向けて

視覚-言語統合に基づくゼロショット人間-物体相互作用検出研究 学術的背景 人間-物体相互作用(Human-Object Interaction, HOI)検出は、コンピュータビジョン分野における重要な研究テーマであり、画像内の人間と物体の間の相互作用を識別することを目的としています。従来のHOI検出手法は主に教師あり学習に依存しており、大量の人手によるアノテーションデータを用いてモデルを訓練する必要があります。しかし、この手法は未見の物体カテゴリに対して汎化能力が限られています。さらに、現実世界における人間-物体相互作用は多様で複雑であり、すべての可能な相互作用カテゴリを手動でアノテーションすることは時間と労力がかかります。 近年、視覚-言語モデル(Vision-Language Model...