EEG解読のための深層学習を用いたユークリッド整列の体系的評価

EEG解読におけるユークリッド整列と深層学習の系統的評価

背景紹介

脳波(EEG)信号は、非侵襲性、携帯性、低コストな収集などの利点から、脳コンピューターインターフェース(BCI)タスクで広く利用されています。しかし、EEG信号には低い信号対雑音比、電極位置の影響を受けやすい、空間分解能が低いなどの欠点があります。深層学習(DL)技術の進歩に伴い、この技術はBCI分野で優れた性能を示し、場合によっては従来の機械学習手法を上回っています。しかし、DLモデルには大量のデータが必要であるという主な障害があります。複数の被験者データを使った転移学習(Transfer Learning、TL)は、データ共有によってDLモデルをより効率的に訓練できます。ユークリッド整列(Euclidean Alignment、EA)は、使いやすさ、計算コストの低さ、DLモデルとの互換性から徐々に注目を集めています。しかし、EAとDLの組み合わせによるグローバルモデルとインディビジュアルモデルの訓練効果の評価は十分ではありません。本論文では、EAとDLの組み合わせがBCI信号解読のトレーニング性能に与える影響を系統的に評価することを目的としています。

論文情報と著者

本論文の題名は「Systematic Evaluation of Euclidean Alignment with Deep Learning for EEG Decoding」で、Bruna Junqueira、Bruno Aristimunha、Sylvain Chevallier、Raphael Y. De Camargo らが執筆しました。著者らはサンパウロ大学、パリ=サクレー大学(Inria TAU Team、LISN-CNRS)、ABC連邦大学に所属しています。本論文は学術誌に掲載され、通信著者はBruna Junqueira(brunaafl@usp.br)です。

研究方法

EEG解読フレームワーク

EEG解読問題は、記録された信号から心理状態を分類することであり、BCIにおいて重要な意味を持ちます。データセットEは、n個の実験とラベルの組(x_i、y_i)で構成されています。ここで、実験記録Xはc行t列の行列で、cはチャンネル数、tは時間ステップ数です。特徴空間はX∈R^c×tです。本実験では左右手の運動想起のみを扱い、分類ラベル空間は{‘left_hand’、’right_hand’}となります。

脳波信号のばらつきを考慮し、異なる被験者からの周辺分布p_k(・)は異なると仮定します。分類には未知の決定関数fθ(・)があり、その パラメータθがfθ(x)=yを満たすと想定されます。標識付きデータを神経網に入力し、平均損失ℓを最小化することで学習します。

[ \min_θ \frac{1}{nt} \sum{i=1}^{n_t} ℓ(fθ(x_i), y_i) ]

本研究では、すべての実験に負の対数尤度損失とAdamW最適化手法を適用しています。

転移学習フレームワーク

ドメインdは特徴空間Xと周辺分布p(x)で定義され、タスクtはラベル集合Yと決定関数f(X)で定義されます。本研究では、各個人をドメインと見なし、既知のドメインを送信ドメイン、未知のドメインを受信ドメインとします。転移学習フレームワークでは、送信ドメイン(D_s)と送信タスク(T_s)でモデルを学習し、受信ドメイン(D_t)と受信タスク(T_t)に適用します。

ユークリッド整列

ユークリッド整列(EA)は、各被験者のすべての実験の共分散行列を単位行列に合わせることで、被験者間の差異を減らします。n人の被験者からn個の実験があるとすると、共分散行列は以下のように定義されます。

[ R̄j = \frac{1}{n} \sum{i=1}^{n} X_j_i X^T_j_i ]

変換行列は、R̄jの平方根の逆行列として定義され、各実験に適用されます。

データセット

本研究では、BCI Competition 4のDataset IIA(BNCI2014)とSchirrmeister2017(高ガンマ)の2つのデータセットを使用しています。BNCI2014には9人の健康被験者のデータが含まれ、左手、右手、両足、舌の4種類の運動想起タスクが行われています。高ガンマデータセットには14人の健康被験者のデータが含まれ、左手、右手、両足、休憩のタスクが行われています。結果の一貫性を保つため、左手と右手のデータのみを使用しています。標準的な前処理手順としてバンドパスフィルタリングとリサンプリングが行われています。

モデルとデータ分割

本研究では、EAの適用を以下の2つのシナリオで分析しています。

  1. すべての送信被験者のデータを使用する(交差被験者モデル)。
  2. 各送信被験者のデータを使用する(個別モデル)。

運動想起の2クラス分類タスクを使用し、受信被験者の2クラス分類タスクで評価を行っています。テスト、検証、トレーニングセット間のデータリークを防ぐためです。

評価モデルとしてEEGNet、ShallowNet、DeepNetを使用し、比較の公平性を確保しています。

データ整列

オフラインとオンライン疑似実験では、異なる方法でEEGデータを整列しています。オフライン実験では、各被験者のすべての実験に対して整列を行っています。疑似オンライン実験では、受信被験者の最初の24試行のみを使って基準行列を計算し、テストデータを整列しています。

モデルトレーニング

交差被験者モデルでは、leave-one-subject-outの分割を使用しています。個別モデルではすべてのデータを使い、20%を検証に使用しています。各受信被験者に対して個別のモデルを学習し、多対多のトレーニングスキームを評価しています。トレーニングではバッチサイズ64、1000エポック、早期終了250回、ドロップアウト率25%を設定し、学習率と重み減衰パラメータは調整されています。

研究結果

転移学習におけるユークリッド整列

ユークリッド整列は、評価したすべてのデータセットとアーキテクチャにおいて解読性能を向上させました。すべての被験者データでオフラインでEAを適用した場合、運動想起タスクの精度が1.26%向上しました。一方、オンラインEAでは非整列時に比べて全体的に4.33%の精度向上がみられ、トレーニング時間は約70%短縮されました。

ファインチューニングが共有モデルに与える影響

非整列の場合、ファインチューニングによって平均精度が1.43%向上しました。しかし、オフラインEAとオンラインEAでは、ファインチューニングによる顕著な変化はみられませんでした。これは、EAによりデータ分布がかなり一貫したものになり、その場合ファインチューニングには受信ドメインのより多くのデータが必要になるためと考えられます。

被験者間の伝達性の分析

ユークリッド整列は、個別モデルの被験者間伝達性を高めました。良いドナー被験者はレシーバーとしても良好な性能を示す傾向があり、EAによりこの関連性が強まり、データ分布がより一貫したものになりました。しかし、EAでは良い/悪いドナーの構造自体は変わりませんでした。

転移学習における投票分類器の応用

EAは個別モデルの伝達性を明らかに向上させました。重み付き多数決投票分類器を使って受信被験者を分類した場合、異なる組み合わせの個別モデルを使うことで、EAにより平均精度が3.71%向上しました。一方、共有モデルに比べて平均精度は3.62%低下しました。しかし、投票分類器は構築が柔軟で、新しいデータソースを追加する際に全体を再トレーニングする必要がありません。

意義と価値

本研究は、ユークリッド整列がDL併用時に優れたドメイン適応手法であることを示しました。EAは、複数被験者データを使ったモデルの解読精度とトレーニング時間を大幅に改善しました。交差被験者モデルを学習する際、EAは標準的な前処理手順として適用されるべきです。将来の研究では、DLモデルにおけるEAの高速収束問題や、さまざまなハイパーパラメータがモデル性能に与える影響を詳しく調べ、EAの応用範囲をさらに広げることが期待されます。

EEG解読におけるEAとDLの組み合わせの系統的な評価により、BCI分野の技術進歩が促進されるだけでなく、さらなる研究の方向性も示唆されています。本研究は、EAが被験者間の信号のばらつきを低減する可能性を明らかにし、より効果的な転移学習の道筋を提供しました。これは、BCIテクノロジーの実用化に向けた重要な指針となります。