DeepSleepNet: 生の単一チャネルEEGに基づく自動睡眠段階スコアリングモデル
深度睡眠ネットワーク:シングルチャネルEEGに基づく自動睡眠ステージスコアリングモデル
背景紹介
睡眠は人体の健康に重要な影響を持ち、人々の睡眠の質を監視することは医学研究および実践において極めて重要です。通常、睡眠専門家は複数の生理信号(脳波図 (EEG)、眼電図 (EOG)、筋電図 (EMG)、心電図 (ECG) など)を分析することで睡眠ステージをスコアリングします。これらの信号は多導睡眠ポリグラフ (Polysomnogram, PSG) と呼ばれ、分類後に個人の睡眠状態を特定するために使用されます。しかし、この手動方法は時間がかかり、労力が必要であり、専門家が複数の夜に渡って複数のセンサーを記録し分析する必要があります。
複数の信号(EEG、EOG、EMG など)やシングルチャネルEEGに基づく自動睡眠ステージスコアリング方法は広く研究されています。しかし、既存の多くの方法は手動で特徴を抽出することに依存しており、これらは通常データセットの特性に基づいて設計されているため、異質性を持つ大規模な人々に対しては適用しにくいです。さらに、睡眠ステージの移行ルールを識別するための時間情報を考慮している方法は少ないです。最近、深層学習を用いた自動睡眠ステージスコアリングの応用が検証されましたが、睡眠専門家がスコアリング時に使用する時間情報を無視することが多く、その結果、パフォーマンスが制限されることがあります。
出典紹介
本稿は「DeepSleepNet: A Model for Automatic Sleep Stage Scoring Based on Raw Single-Channel EEG」というタイトルで、Akara Supratak、Hao Dong、Chao Wu、Yike Guo によって執筆され、2017年11月の《IEEE Transactions on Neural Systems and Rehabilitation Engineering》に発表されました。この研究は英国ロンドンのインペリアル・カレッジ・ロンドンのコンピュータ科学部門の研究チームによって行われました。
DeepSleepNet研究の詳述
研究プロセス
DeepSleepNetモデルは、特徴学習とシーケンシャル残差学習の二つの部分で構成されています。
特徴学習フェーズ
- 異なるフィルターサイズの二つの畳み込みニューラルネットワーク (CNN) を使用して時間不変な特徴を抽出:
- 小さいフィルターはEEGパターンの時間情報を捉えるのに適しており、大きいフィルターは周波数情報を捉えるのに適しています。
- 各CNNは四つの畳み込み層と二つの最大プール層で構成され、一次元の畳み込み、バッチ正規化、およびReLU活性化が行われます。
h_s_i = CNN_θ_s(x_i)
h_l_i = CNN_θ_l(x_i)
a_i = h_s_i || h_l_i
ここで、CNN_θ(x_i)は30秒のEEGセグメントを特徴ベクトルに変換する関数を表し、出力を合成してシーケンシャル残差学習部分に渡します。
シーケンシャル残差学習フェーズ
- 双方向長短期記憶ネットワーク (Bi-LSTM) を用いて時間情報を学習する:
- 二層のBi-LSTM: AASMマニュアルのステージルールのような睡眠ステージの移行ルールを学習。
- ショートカット接続: 残差関数を再計算し、CNNから得た特徴と入力シーケンスから学んだ時間情報を組み合わせることができるようにします。
h^f_t, c^f_t = LSTM_θ_f(h^f_t-1, c^f_t-1, a_t)
h^b_t, c^b_t = LSTM_θ_b(h^b_t+1, c^b_t+1, a_t)
o_t = h^f_t || h^b_t + FC_θ(a_t)
- モデルパラメータの設定:
- CNNとLSTMのパラメータ設定は、EEGの時間および周波数情報をキャプチャするために行われ、小さなフィルターは長期間の依存関係を制限し、大きなフィルターは高周波数の特徴を捉えます。
- ドロップアウトおよびL2正規化などの正則化技術により過剰適合(過学習)を防ぎます。
訓練アルゴリズム
モデルを効果的に訓練するために、二段階の訓練アルゴリズムが提案されました: 1. 事前訓練: 特徴学習部分を均衡データセットで事前訓練し、過学習を防止します。 2. 微調整: 時系列データセットを用いて全体のモデルを微調整し、時間情報をエンコードし事前訓練されたCNNパラメータを調整します。
Algorithm 1: Two-step Training
1. Pre-training step
- Oversample data
- Train CNNs with balanced data
2. Fine-tuning step
- Replace pre-trained CNNs
- Train entire model with sequential data
実験と結果
データセット:
- MASSデータセット: 62名の健康な被験者のPSG記録を含み、手動で五つの睡眠ステージ (W, N1, N2, N3, REM) にラベル付けされています。
- Sleep-EDFデータセット: 20名の被験者を含み、PSG記録はR&K標準の八つのカテゴリーに手動分類され、N3とN4ステージを統合してAASM標準に準拠しています。
パフォーマンス指標:
- モデルのパフォーマンスはk折交差検証を用いて評価され、精度 (Acc)、マクロF1スコア (mF1)、コーエンのκ係数などの指標が含まれます。
結果分析:
- DeepSleepNetは、異なるシングルチャネルEEGデータセットで最先端の手動特徴抽出方法と同等の全体精度とマクロF1スコアを実現しました。
- 双方向LSTMによって学習された時間情報は分類性能を大幅に向上させ、シーケンシャル残差学習の有効性を確認しました。
既存の方法との比較:
- 二つのデータセット (MASSおよびSleep-EDF) において、DeepSleepNetのパフォーマンス指標は既存の手動特徴抽出およびシングルチャネルEEGの深層学習方法よりも優れているか、同等であることが示されました。
研究の意義と価値
DeepSleepNetモデルはCNNとBi-LSTMネットワークを組み合わせることによって、初めて手動特徴抽出を必要とせず、シングルチャネルEEGデータから自動的に睡眠ステージのスコアリングに使用される特徴を学習することを実現しました。モデルは異なるデータセットのサンプリングレートとスコアリング基準に適応することができ、卓越した汎化性能を示しました。研究結果は、DeepSleepNetが遠隔睡眠モニタリングに対してより効果的な方法を提供できることを示しており、専門家の手動アノテーションへの依存を排除し、自動化の程度と精度を向上させることができることを示しています。
ハイライトと革新性
- 革新的なモデルアーキテクチャ: CNNとBi-LSTMを組み合わせ、時間不変な特徴抽出と時間情報の学習を実現。
- 効果的な訓練アルゴリズム: 二段階訓練方法は、大規模データセットのクラス不均衡問題を克服。
- 優れた汎化能力: 異なるデータセットおよび異なるチャネルで一貫した高性能を示す。
まとめと今後の研究
DeepSleepNetモデルは、手動特徴抽出を必要としない新しい深層学習に基づく自動睡眠ステージスコアリング方法を示し、シングルチャネルEEGデータに適用可能です。将来的には、このモデルをウェアラブルデバイスから収集されたシングルチャネルのEEGデータに適用し、自宅環境や臨床における遠隔睡眠モニタリング評価を実現することを計画しています。