多サイト静止状態fMRIデータセットを使用した精神疾患分類パイプラインの包括的評価

背景紹介

精神医学の分野では、長い間、症状と医学的インタビューに基づいて診断が行われており、客観的なバイオマーカー(biomarkers)が不足していました。安静時機能的磁気共鳴画像法(resting-state functional magnetic resonance imaging, rs-fMRI)は、脳の構造と機能の特徴的なパターンを明らかにし、精神疾患の診断に潜在的な分類マーカーを提供できると広く考えられています。しかし、分析パイプラインの多様性により、現在までに広く受け入れられたマーカーは確立されていません。異なる分析パイプラインの選択は、診断と汎化性能に大きな影響を与えますが、理想的なパイプラインを体系的に探求した研究はほとんどありません。したがって、本研究は、大規模で多施設のrs-fMRIデータセットを使用して、大うつ病性障害(major depressive disorder, MDD)の分類マーカーのための分析パイプラインを包括的に評価し、精神疾患の診断に標準化されたプロセスを提供することを目的としています。

論文の出典

多施設安静態fMRIデータセットに基づく精神疾患分類パイプラインの包括的評価 本論文は、日本の複数の研究機関からなるチームによって共同で行われ、主要な著者にはYuji Takahara、Yuto Kashiwagi、Tomoki Tokudaなどが含まれます。研究チームは、Advanced Telecommunications Research Institute International、Shionogi & Co., Ltd.、The University of Tokyoなどの機関から構成されています。論文は2025年2月28日に《Neural Networks》誌にオンライン掲載され、DOIは10.1016/j.neunet.2025.107335です。

研究の流れ

1. データセットと前処理

研究では、以下の3つのデータセットを使用しました: - データセットI:713名の参加者(564名の健康対照と149名のMDD患者)を含み、4つの施設から収集され、統一されたプロトコルでデータが取得されました。 - データセットII:449名の参加者(264名の健康対照と185名のMDD患者)を含み、4つの独立した施設から収集され、異なるプロトコルでデータが取得されました。 - データセットIII:231名の参加者(125名の自閉症スペクトラム障害患者と106名の統合失調症患者)を含み、パイプラインの汎化能力を検証するために使用されました。

データの前処理はfMRIprepツールを使用して行われ、スライスタイミング補正、モーション補正、共登録、歪み補正、T1強調画像のセグメンテーション、標準化などのステップが含まれました。

2. 分析パイプラインの構築

研究では、以下の4つのサブプロセスのオプションの組み合わせを探求しました: - 脳領域分割(parcellation):Glasserの表面分割、Shenのアトラス、データ駆動型の辞書学習など6つの方法が含まれます。 - 機能接続性(functional connectivity, FC)の推定:Pearsonの全相関、接線空間共分散、偏相関、距離相関など4つの方法が含まれます。 - 施設間差異の補正(harmonization):旅行被験者補正、Combat補正、無補正など3つの方法が含まれます。 - 機械学習方法:Lasso、スパースロジスティック回帰、Ridge、サポートベクターマシン(SVM)、ランダムフォレストなど5つの方法が含まれます。

これらのオプションを組み合わせることで、合計360種類の異なるMDD分類マーカーが構築されました。

3. 分類マーカーの構築と検証

データセットIを発見データセットとして使用し、MDD分類マーカーを構築し、10分割ネストされた交差検証(cross-validation, CV)で評価しました。その後、マーカーをデータセットIIに適用して独立した検証を行いました。データセットの依存性を排除するために、データセットIとデータセットIIの役割を交換し、上記のプロセスを繰り返しました。

4. 性能評価

評価指標には、曲線下面積(area under the curve, AUC)、精度、感度、特異度、Matthews相関係数(MCC)が含まれます。研究ではまた、「総合スコア」(composite score)と「不安定性」(instability)という2つのカスタム指標を定義し、マーカーの性能を包括的に評価しました。

5. マーカーの類似性分析

研究では、上位10位のマーカーの分類結果と重みの類似性を分析し、その一貫性を検証しました。機能接続性をYeoらの脳ネットワークにマッピングすることで、異なるマーカー間の重要な機能接続性のネットワーク使用率を比較しました。

6. 他の精神疾患への適用

研究では、上位10のパイプラインを自閉症スペクトラム障害(ASD)と統合失調症(SCZ)のデータセットに適用し、これらの疾患における分類性能を検証しました。

主な結果

1. 分類性能の比較

研究では、Glasserの表面分割とデータ駆動型の辞書学習が脳領域分割において最も優れており、Pearsonの全相関と接線空間共分散が機能接続性の推定において優れていることがわかりました。施設間差異の補正では、旅行被験者補正と無補正の方法が同等の性能を示し、Combat補正の性能は有意に低いことが明らかになりました。機械学習方法では、非スパース方法(RidgeやSVMなど)がスパース方法よりも優れていることが示されました。

2. データセットの役割交換による検証

データセットIとデータセットIIの役割を交換することで、パイプラインの汎化能力が検証されました。結果は、Glasserの表面分割とPearsonの全相関方法が異なるデータセットの役割においても安定した性能を示すことを裏付けました。

3. マーカーの類似性

上位10位のマーカーは、分類結果において高い一貫性を示し、重みパターンも8つのマーカー間で高い類似性を示しました。データ駆動型の辞書分割と接線空間共分散を使用した2つのマーカーは、他のマーカーとの重みの類似性が低く、異なるMDDの特徴を捉えている可能性が示唆されました。

4. 他の精神疾患への適用

ASDとSCZの分類において、上位10のパイプラインのうち8つが十分な分類性能を示し、これらのパイプラインが他の精神疾患においても広く適用可能であることが示されました。

結論と意義

本研究は、大規模で多施設のrs-fMRIデータセットを使用して、MDD分類マーカーのための分析パイプラインを包括的に評価し、脳領域分割、機能接続性の推定、施設間差異の補正、機械学習方法における最適なオプションを特定しました。研究結果は、Glasserの表面分割、Pearsonの全相関、無補正、非スパース機械学習方法が、高い汎化性能を持つ分類マーカーの構築において優れていることを示しています。さらに、これらのパイプラインはASDとSCZの分類においても良好な性能を示し、精神疾患の診断に標準化されたプロセスを提供します。

研究のハイライト

  1. 体系的評価:本研究は、Glasserの表面分割、距離相関、施設間差異補正などの複数の先進的な方法を統一されたフレームワークで体系的に評価した初めての研究です。
  2. 汎化性能の検証:データセットの役割を交換することで、パイプラインの汎化能力が検証され、異なるデータセットにおける堅牢性が確認されました。
  3. 多疾患への適用:上位10のパイプラインをASDとSCZに適用し、これらのパイプラインが複数の精神疾患において広く適用可能であることを証明しました。

その他の有益な情報

本研究のデータとコードは、DECNEFプロジェクトの脳データリポジトリ(https://bicr.atr.jp/decnefpro/data)を通じて入手可能であり、他の研究者にとって貴重な研究リソースを提供しています。