PEDアルゴリズムを用いた自閉症スペクトラム障害の診断バイオマーカーの特定
PEDアルゴリズムを用いた自閉スペクトラム症の診断バイオマーカーの識別
神経情報科学の領域では、自閉スペクトラム症(ASD)の研究は主に脳領域間の双方向接続関係に焦点を当てており、脳領域の高次相互作用異常にはあまり触れられていません。脳領域の複雑な関係を探るため、著者らは部分エントロピー分解(Partial Entropy Decomposition, PED)アルゴリズムを採用し、三つの脳領域(トリオード)の高次相互依存性を計算することで高次相互作用を捉えました。本論文では、PEDと代替検証法に基づく方法を提案し、単一の脳領域が三重脳領域に及ぼす影響を検証し、重要な三重脳領域を見つけました。さらに、超グラフモジュール最適化アルゴリズムを用いて高次脳構造を明らかにし、ASDでは右脳と左脳の接続が典型的な対照群(TC)に比べて緩やかであることを示しました。重要な冗長三重脳領域(左小脳、左楔前葉、右下枕回)の相互作用は顕著な減衰を示し、協調的な重要三重脳領域(右小脳、左中央後回、左舌回)の相互作用は明らかに低下しました。分類モデルの結果は、重要三重脳領域が診断バイオマーカーとしての潜在性を持つことをさらに確認しました。
研究背景と問題
自閉スペクトラム症(ASD)は、神経発達性の局所性を持たない脳疾患であり、主な特徴は社会的コミュニケーション障害、興味の狭さおよび繰り返し行動です。ASDの診断は通常、行動観察、臨床インタビュー、アンケート調査に依存していますが、これらの方法は誤診をもたらす可能性があります。ASDを診断する客観的なバイオマーカーを探すことが非常に重要です。ASDの神経変化を解明する際、ASDは接続組機能障害症候群と考えられ、脳の本質的な機能接続の異常として現れます。機能接続は二つの脳領域間の相関性として記述され、ASD関連の研究に広く用いられています。さらに、もう一つの脳接続タイプとしては、効果的接続があり、よく用いられる方法にはグレンジャー因果関係や条件エントロピーなどがあり、研究者は異なる脳領域間の情報伝達経路を理解するのに役立ちます。しかし、効果的接続も機能接続も二つの脳領域間の影響作用のみを記述しています。脳領域内の複雑な関係を考慮に入れ、多数の脳領域の高次相互作用を解析することは不可欠です。
論文出典
本論文は江南大学のHao Wang、Yanting Liu、およびYanrui Dingにより執筆され、2024年3月23日にSpringer Science+Business Media, LLC, part of Springer Natureにより受理され、《Neuroinformatics》ジャーナルに掲載されました。
研究方法と作業フロー
研究は主に以下のステップを含みます: 1. データセット:ASDとTCの安静時機能的磁気共鳴画像(rs-fMRI)データを使用し、データはNYU Langone Medical Centerの自閉症脳画像データ交換プロジェクト(ABIDE)第1期から取得しました。 2. データ前処理:脳部血中酸素レベル依存(BOLD)信号に対し、データの分離時の校正、強度の正規化、画像の再調整などの前処理を実施しました。 3. 部分エントロピー分解(PED)および高次依存性の測定:PEDアルゴリズムを用いてすべての三脳領域(トリオード)の冗長情報と協調情報を計算し、これらの情報は高次脳構造を表現し、ASDとTCを区別するための重要な三脳領域をフィルタリングしました。 4. 分類モデル構築:重要な三脳領域の情報(冗長情報と協調情報)を特長として用い、サポートベクターマシン(SVM)分類器を訓練し、グリッド検索法を用いて最適なパラメータを決定し、十重交差検証で分類結果のロバスト性を評価しました。
データセットおよび前処理
研究はABIDE Iプロジェクトの安静時機能的磁気共鳴画像(rs-fMRI)データを使用しました。このデータセットは匿名化され、HIPAAガイドラインに従って保護された健康情報を含んでいません。データセットは三人の人類学者によってスクリーニングされ、不完全な脳カバレッジ、高ピーク運動、ゴースト現象、およびスキャナアーティファクトのある被験者を除外しました。最終的に選ばれたのは、172名の被験者で、74名がASD、98名がTCでした。被験者の脳領域はCraddock 200(CC200)アトラスで定義され、このアトラスは脳を200の異なる領域に分け、可利用な脳接続解析パイプライン(C-PAC)を使用してデータを前処理しました。
部分エントロピー分解(PED)および高次依存性の測定
PEDアルゴリズムを用いてASDおよびTC被験者の全ての三脳領域の冗長情報と協調情報を計算し、代替データ検証を利用して各脳領域が三脳領域において重要であるかを評価しました。脳領域の時間系列をランダムデータに置換した際に、高次依存性測定値を再計算し、その値が元の高次依存性測定値と有意に異なるかどうかを見つけ、重要な三脳領域を確定しました。
PEDに基づく分類モデル
分類モデル構築: - 重要な三脳領域の冗長情報と協調情報を特長ベクトルとして抽出し、サポートベクターマシン(SVM)分類器に入力して訓練を行います。 - 五つの異なる方法でデータを訓練セットとテストセットに分け、十重交差検証を用いて分類結果の安定性を評価し、分類質を正確性、感度、特異性、F1スコア、およびROC曲線下面積を用いて測定しました。
研究結果
冗長および協調構造の群間差異
超グラフモジュール最大化アルゴリズムを用いて各被験者の冗長および協調構造を生成し、古典的な七つのYeoシステムと関連解析を行いました。結果は、ASDとTC被験者間においていくつかの脳領域対の冗長情報と協調情報に顕著な差異があることを示し、特に左小脳および右下枕回などの脳領域が高い冗長情報と協調情報差異を示しました。
高次依存性測定の群間差異
二標本t検定を通じて、ASDが25-183-190の三脳領域における冗長相互作用の増加を示し、18-31-42、20-62-102などの多くの三脳領域における冗長および協調相互作用の減少を示しました。
重要な三脳領域パターンの群間差異
ASDとTCの間で重要な三脳領域パターンが変化していることに注意が必要で、特に18-108-150、25-183-190などの重要な三脳領域において、ASDではより一般的なパターンが(0, 0, 0)であり、これらの脳領域がASDにおいて全体的に一般的な状態を示していることを意味しています。
ASD-TC分類モデルのパフォーマンス
重要な三脳領域の冗長情報と協調情報を特長として用いて分類モデルを構築した場合、冗長情報を特長として使用したときの正確性は85%、協調情報を特長として使用したときの正確性は80%でした。冗長情報と協調情報を統合して特長として使用した際の正確性は83%であり、異なる訓練セット/テストセット分割で最高正確性は97%に達しました。
結論および研究の意義
本論文ではPEDと代替検証を組み合わせた方法を提案し、単一の脳領域研究におけるPEDの制限を解決しました。研究結果は、ASDにおける三脳領域間の相互作用または情報伝達経路の変化が、単一の脳領域の異常な状態によって引き起こされることを示しました。分類モデルの検証は、重要な三脳領域が潜在的な診断バイオマーカー価値を持つことを示しており、ASDの識別に重要な基盤を提供しました。これらの結果は、ASD脳機能組織と認知行動変化の理解を深めるだけでなく、後続の研究に重要な方向性を提供します。