診断予測のための段階認識階層型注意関係網

診断予測における階層的注意関係ネットワークの応用

近年、電子健康記録(Electronic Health Records、略してEHR)は医療意思決定の向上やオンラインでの病気の検出と監視において極めて価値があります。同時に、深層学習に基づく方法はEHRを利用した健康リスク予測や診断予測で大きな成功を収めました。しかし、深層学習モデルには通常、大量のデータが必要であり、その理由はパラメータの膨大な数にあります。さらに、EHRデータには多くの希少な医療コードが存在し、これが臨床応用に大きな課題をもたらします。このため、一部の研究では医療オントロジーを用いて予測性能を強化し、解釈可能な予測結果を提供することが提案されています。しかし、これらの医療オントロジーは通常、規模が小さく、粒度が粗いため、多くの診断や医療概念が欠如しており、これらの概念間の様々な関係については言うまでもありません。

この制約を克服するために、本論文では既存の大規模な医療知識グラフ(Knowledge Graph、略してKG)を診断予測に組み込み、HAR(階層的注意関係ネットワーク、Hierarchical Attentive Relational Network)というモデルを設計しました。具体的には、各診察ごとに、既存の医療KGからパーソナライズされたサブKGを抽出し、HARはこのサブKG上で関係特有のメッセージ伝達と階層的メッセージアグリゲーションを行い、診察における医療コードに対応するノード表現を細化します。HARは患者の病気の進行段階を考慮し、これが関係レベルおよびノードレベルの注意計算に関与します。2つの公開データセットに対する広範な実験により、HARが診断予測タスクの診察レベルの精度およびコードレベルの正確性を向上させることが実証されました。

研究背景

今日、電子健康記録(EHR)は広く使用されている医療情報技術となっています。EHRデータは時間順に診察を表し、各診察には複数の臨床診断を表す医療コードが含まれています。研究により、これらのEHRデータは医療サービスの効率を向上させるだけでなく、医療概念の抽出や疾病予測などのタスクにも利用できることが示されています。また、深層学習モデルはコンピュータビジョン、自然言語処理、グラフニューラルネットワーク、データマイニングなどの分野で大きな成功を収めており、自然な形で、EHRデータのモデリングにも多くの深層学習に基づく方法が提案されています。これらの方法は少ない前処理と特徴工学を必要とし、より良い性能を実現できます。

しかし、深層学習に基づくEHRモデルは通常、大量のデータを必要とし、その理由はパラメータの膨大な数にあります。そのため、訓練データセットの規模が限定される場合、性能は通常あまり満足のいくものではありません。さらに、EHRデータにはかなりの割合で頻度の低い医療コードが含まれており、これらの希少な医療コードを正確に表現することは難しいです。このような状況下で、研究者は深層学習モデルの性能を向上させるために外部の医療知識を導入することを提案しています。

例えば、GRAM(グラフ構造注意モデル、Graph-based Attention Model)は神経注意力を通じて医療オントロジー——臨床分類ソフトウェア(Clinical Classifications Software、略してCCS)を深層学習モデルに導入しました。しかし、医療オントロジーの利用には二つの主な制約があります。一方では、ほとんどの医療オントロジーの規模は相対的に小さいです。例えば、CCSには数百の概念しか含まれておらず、多くの診断には対応する概念がないです。もう一方では、オントロジーは本質的に疾病分類ツリーであり、異なる疾病間の様々な関係情報を含んでおらず、病気の進行を反映することは言うまでもありません。そのため、我々は既存の大規模医療知識グラフSemMed(Semantic MEDLINE)を診断予測に導入することを提案します。

いくつかの研究は既に大規模な医療知識グラフの利用を提案していますが、これらは患者の具体的な段階を考慮していません。例えば、発熱という診断は異なる段階で異なる重症度を反映するかもしれません。発熱のために診察を受けた患者に対して、経験豊富な医師は異なる病歴に基づいて異なる処理方法を取ります。

研究出典

本論文はLiping Wang、Qiang Liu、Mengqi Zhang、Yaxuan Hu、Shu Wu、およびLiang Wangによって執筆され、2024年4月のIEEE Transactions on Knowledge and Data Engineering誌に掲載されました。この研究の一部は国家自然科学基金の支援を受けました。

研究方法

HARモデルは4つの主要部分から構成されます:段階認識関係レベル注意モジュール、段階認識ノードレベル注意モジュール、関係特定メッセージ伝達モジュール、および階層メッセージアグリゲーションモジュール。このモデルは汎用モジュールとして設計されており、様々な時間予測モデルと組み合わせて使用できます。

パーソナライズされたグラフ抽出

各診察に対して、大規模な医療知識グラフから個別のサブグラフを抽出し、モデルはこれらのサブグラフ上で関係特定のメッセージ伝達と階層的メッセージアグリゲーションを行います。これらのパーソナライズされたサブグラフは、患者の現在の病状に関連する知識点を表し、患者に無関係なノード間の情報伝達を避けます。

医療コード埋め込み

離散的な医療コードを合理的かつ学習可能な表現に変換することが非常に重要です。本論文では、パラメトリックな埋め込み行列を採用し、医療コードを訓練可能な埋め込みベクトルとしてエンコードし、エンドツーエンドでパラメータ行列を自動学習します。

段階認識の関係レベルとノードレベルの注意

このメカニズムは、患者の病気の進行段階の具体的な状況を考慮し、異なる関係タイプおよび近傍ノードに異なる重みを割り当てます。下流の予測モデルの隠れベクトルと組み合わせることで、HARは異なる重みを割り当て、関係レベルとノードレベルの注意計算の過程でより識別力のある優先順位を取ります。

関係特定メッセージ伝達と階層メッセージアグリゲーション

パーソナライズされたサブグラフ内で、HARはソースノードからターゲットノードへの情報を伝達し、関係タイプの多様性とその情報伝達の重要性を確保します。情報を集約する際には階層的な方法を採用し、まず同じ関係タイプのノード間でメッセージの伝達と更新を行い、次に複数の関係間で集約し、最終的なノード表現を下流の予測モデルに送ります。

エンドツーエンドの訓練と既存の予測モデルとの組み合わせ

HARモデルは既存の予測モデルPと共に訓練され、目標はマルチラベル分類タスクであり、クロスエントロピー損失関数を採用します。勾配降下法を通じて、HARモデルと予測モデルPは共同で最適化されます。

実験結果

本論文では、2つの公開データセットMIMIC-IIIとMIMIC-IVで広範な実験を行うことで、HARの有効性を検証しました。実験結果は、HARが診察レベルの精度とコードレベルの正確性の両方で予測性能を向上させることを示しました。さらに、消尽研究により、モデルアーキテクチャの合理性および HAR の全体的な性能向上における各コンポーネントの重要性が検証されました。ケーススタディでは、HARによって生成された注意係数が診断予測に対する明示的な説明を医師に提供できることが確認されました。

実験設定とデータセット

実験では、MIMIC-IIIとMIMIC-IVの2つの公開可能なEHRデータセットを選択しました。これらのデータセットにはICU患者の健康記録が含まれています。実験は主にこれらのデータセット内の診断コードに焦点を当て、これらのコードを利用して予測タスクを行いました。さらに、実験には大規模な医療知識グラフSemMedも使用されており、この知識グラフには15万以上のエンティティと64種類の関係タイプが含まれています。

パフォーマンス比較

LSTM、RETAIN、DIPLOE、RAIM、StageNet、HiTANetなどの様々なベースラインモデルと比較することで、実験結果はHARを組み込んだモデルが診察レベルおよびコードレベルの両方で優れた性能を示し、特に希少疾病と少量データセットの処理においてHARモデルの改良が顕著であることが示されました。

消尽研究

消尽研究によって、段階認識関係およびノードレベルの注意メカニズムがモデル性能の向上に不可欠であることが検証され、異なる注意メカニズムの影響も評価されました。

感度分析

超パラメータλの感度分析の結果により、HARは[0, 0.9]の範囲で一定のロバスト性を保つことが示され、モデルにおける外部医療知識の有効性が反映されました。

モデルの解釈性

ケーススタディは、HARが生成した注意係数を分析することで、異なる疾病症状間の関係を明らかにし、臨床医に明示的な説明を提供できることを示しました。

結論

本論文で提案したHARモデルは、既存の診断予測モデルが持つデータ量と希少医療コードの課題を効果的に克服し、大規模な医療知識グラフを診断予測に導入することで、顕著な性能向上を実現しました。さらに研究を進めることで、HARモデルは良好な解釈性を示し、臨床実際の応用において強力なサポートを提供する可能性があります。