ストローククラシファイア:電子健康記録を使用したアンサンブルコンセンサスモデリングによる虚血性脳卒中病因の分類

StrokeClassifier:人工知能ツールは電子健康記録に基づいて虚血性脳卒中を病因別に分類

プロジェクト背景および研究動機

脳卒中(特に急性虚血性脳卒中、AIS)の病因識別は二次予防において極めて重要ですが、その診断は非常に困難です。アメリカでは毎年約67.6万件の新たな虚血性脳卒中のケースが報告され、そのうち4分の1の患者は過去に脳卒中の経験があります。この病状は再発率が高く、時には死亡やさらなる障害を引き起こすこともあります。虚血性脳卒中の病因は、大動脈粥状硬化、心源性塞栓症、小血管病、その他の稀な原因など多岐にわたります。しかし、アメリカでは約20-30%の虚血性脳卒中患者が評価を受けてもなお病因が確定せず、隠源性脳卒中として分類されます。この部分の患者は再発脳卒中のリスクが特に高いです。したがって、隠源性脳卒中の病因を正確に識別することは、治療計画を最適化し、患者の予後を改善するために重要です。しかし、正確な診断を行うには、臨床史、身体検査結果、検査データ、心臓リズム検査、イメージング検査など大量のデータを統合する必要があります。血管専門医の不足により、診断能力が制限される可能性があります。本論文の著者たちは、電子健康記録(EHR)に基づく自動化された人工知能ツールを開発し、脳卒中の病因を分類することで、診断の正確さと一貫性を向上させることを目指しています。

論文および著者情報

この研究論文は「strokeclassifier: ischemic stroke etiology classification by ensemble consensus modeling using electronic health records」と題されており、Ho-Joon Lee、Lee H. Schwamm、Lauren H. Sansing、Hooman Kamel、Adam De Havenon、Ashby C. Turner、Kevin N. Sheth、Smita Krishnaswamy、Cynthia Brandt、Hongyu Zhao、Harlan Krumholz、およびRicha Sharmaによって共同執筆されました。論文は《NPJ Digital Medicine》誌に掲載され、ソウル国立大学Bundang病院との協力の特集号で公開されています。

研究プロセスおよび方法

研究対象およびデータソース

論文は、2つの学術病院から収集した2039名の非隠源性AIS患者のEHRテキストデータを選択し、StrokeClassifierという自動分類ツールを開発・検証しました。また、MIMIC-IIIデータセットから406件の退院サマリーテキストが血管神経学者によって外部検証されました。研究は自然言語処理(NLP)技術を利用して退院サマリーテキストから特徴を抽出し、9種類の機械学習分類器からなるアンサンブルコンセンサスモデルを生成しました。血管神経学者の診断結果と比較することで、StrokeClassifierは平均交差検証精度0.74、重み付きF1値0.74を実現しました。MIMIC-IIIデータセットでは、精度と重み付きF1値はそれぞれ0.70と0.71でした。最も重要な5つの特徴は、心房細動、年齢、中大脳動脈閉塞、内頸動脈閉塞、および前頭葉卒中位置でした。デザインされた決定論的ヒューリスティックを用いて、788名の隠源性卒中患者を分類し、隠源性診断率を25.2%から7.2%に減少させました。

アルゴリズムおよびモデル開発

研究サンプルは、AIS診断を持つ出院サマリーテキスト3262件(YNHH、MGH、BIDMCから)から構成されていました。抽出された特徴には、病歴、イメージング、心臓、検査データ、およびUMLS概念の一意識別子(CUI)が含まれます。多様な機械学習アルゴリズム(ロジスティック回帰、サポートベクターマシン、ランダムフォレスト、XGBoostを含む)を使用してモデル訓練が行われ、モデルのハイパーパラメータが最適化されました。2039名の非隠源性卒中サンプルが前処理され、Metamapが入力として使用され、モデル開発が行われました。外部検証サンプルではランダムフォレストベースの補完が使用されました。PCA(主成分分析)を利用してデータの次元削減性能を向上させ、各クラスごとにトップ10の特徴を選択し、更なるモデル開発が行われました。最終的に、多目的モデルで構成された「StrokeClassifier」がアンサンブルコンセンサス分類に採用されました。

研究結果

StrokeClassifierはカテゴリ分類タスクに対する性能評価を行い、正確性およびモデル性能の比較を実施しました。結果として、ロジスティック回帰(LR)、サポートベクターマシン(SVC)、XGBoost(XGB)、ランダムフォレスト(RF)で最適化されたモデルは全て高い交差検証精度とF1スコアを示しました。StrokeClassifierは外部検証において、単一の基本モデルよりも高い予測性能を示しました。バイアス減少方法を一定程度用いることで、アンサンブルモデルはモデル出力のロバスト性と汎用性を高めました。血管神経学者が提供した病因診断結果と比較して、StrokeClassifierは非隠源性卒中の病因予測の平均正確率が0.744、バランス正確率が0.710、重み付きF1が0.740で、神経学者の決定結果と大筋で一致しました。

300回の反復多層交差検証を行った結果、モデルの性能と汎用性をさらに検証しました。年齢、性別、民族サブグループの異なる分析では、StrokeClassifierは各種の実験で適用可能な予測性能を示しました。

誤分類(Misclassification)のサンプルについては、モデルが将来類似データを処理する際の誤判定に対処できるよう、特徴頻度のさらなる分析が実施され、9つの基本モデル全体の検証結果が示されました。特定のトースト病因を持つ隠源性卒中患者に対して、特定のヒューリスティックを用いてさらに分類し、このツールがカテゴリ分類および外部検証データセットにおいて優れた性能を持つことを証明しました。

研究結論および意義

この研究は、StrokeClassifierが自動化された機械学習ツールとして、虚血性脳卒中の病因分類において効率的かつ正確であることを証明し、血管神経学者が提供する診断レベルに匹敵するものであることを示しました。さらなる訓練と臨床応用により、StrokeClassifierは臨床意思決定支援システムとして利用でき、脳卒中の病因診断の正確性を大幅に向上させ、特定の原因に基づいた治療計画の迅速な実行を促進し、臨床研究や公衆衛生の進展を促すことが期待されます。

StrokeClassifierはEHRテキストデータを入力することで、リアルタイム、自動化された方法で脳卒中の病因分類を実現し、広範な応用可能性を持っています。特に専門知識の不足した医療環境において、診断の一貫性と正確性を改善し、効率的な診療プロセスの標準化を推進します。

この研究は詳細なデータ分析とモデル最適化を通じて、将来の研究の堅固な基盤を提供し、複数の臨床および疫学分野でのさらなる応用を通じて、脳卒中の予防と治療における持続的な研究進展と臨床上の利益をもたらすでしょう。