加速度計データの自己監督学習が睡眠と死亡率の関係に新しい洞察を与える

自己監督学習による手首加速度計データが明かす睡眠と死亡率の新たな関連性

現代社会において、睡眠は生命活動に欠かせない基本的な行為であり、その重要性は言うまでもありません。睡眠/覚醒状態や異なる睡眠段階を正確に測定および分類することは、睡眠障害の診断や消費者向けデバイスが提供する運動および心理的健康データの解釈において非常に重要です。しかし、現在のポリソムノグラフィー(Polysomnography, PSG)以外の睡眠分類技術は主にヒューリスティックな方法に依存しており、これらの方法は比較的小規模なサンプル集団で開発されるため、ある程度の限界があります。従って、本研究の目標は手首に装着する加速度計を用いて睡眠段階分類の正確性を確認し、睡眠時間と効率が死亡率とどのように関連しているかを調査することです。 研究フローと機械学習モデルの設計

研究背景

この論文は、Hang Yuanおよびそのチーム(Tatiana Plekhanova, Rosemary Walmsley, Amy C. Reynolds, Kathleen J. Maddisonなど)によって執筆され、2024年のnpj Digital Medicine誌に発表されました。研究の推進力は、現行の方法の大規模応用における限界を克服し、自己監督深層学習法を用いて睡眠段階分類技術を改良することです。

人は生命活動の3分の1を睡眠に費やしますが、自由生活環境での睡眠評価には多くの困難があります。従来の主観的な睡眠日記(Self-report sleep diaries)は個々人の主観的な感覚を捉えられるものの、デバイスで測定される客観的な睡眠パラメータとの関連性は低いです。そして、実験室で行われるポリソムノグラフィーは睡眠測定のゴールドスタンダードとされ、正確な睡眠データを提供しますが、高コストであり複雑なため、大規模研究には適しません。それと比較して、手首に装着する加速度計はその携帯性と低負担の特徴から大規模疫学研究に適しています。

しかし、現在市販および研究用の手首装置では、多くの睡眠評価アルゴリズムが専有技術であり、小規模な集団での検証に留まり、その測定の有効性は明確ではありません。睡眠分類法(覚醒、NREM、REM睡眠段階の区別など)は主に手作業による特徴に依存しており、これらの特徴は信号中の全ての情報を十分に活用できない可能性があります。したがって、データ駆動の手法である深層学習の方が有利であるかもしれません。

論文の出典

この論文は、様々な研究機関からの複数の研究者によって共同執筆され、Oxford大学やSeoul National University Bundang Hospitalなどが含まれます。研究は2024年のnpj Digital Medicine誌に発表され、引用番号は https://doi.org/10.1038/s41746-024-01065-0 です。

研究方法とフロー

研究対象とデータ収集

研究ではまず、UK Biobankにおける70万日時の三軸加速度計データから特徴を抽出するために、多タスク自己監督学習を利用しました。その次に、著者は特徴抽出器を用いて深層回帰ネットワーク(Recurrent Neural Network, RNN)を微調整し、PSGを基準にして睡眠段階分類器を訓練しました。除外を経て、1448人の参加者の夜間データを用いてモデルを訓練しました。内部検証には1395人の参加者が含まれ、外部検証には53人の参加者が含まれました。

ポリソムノグラフィーとの比較

内部検証では、PSGと比較してモデルの総睡眠時間の偏差は8.9分(95% 信頼区間:-89.0分から106.9分)となり、REM睡眠時間の偏差は-18.7分(95% 信頼区間:-130.9分から93.6分)、NREM睡眠時間の偏差は27.6分(95% 信頼区間:-100.6分から155.8分)でした。

外部検証では、総睡眠時間の偏差は34.7分(95% 信頼区間:-37.8分から107.2分)、REM睡眠時間の偏差は-2.6分(95% 信頼区間:-68.4分から73.4分)、NREM睡眠時間の偏差は32.1分(95% 信頼区間:-54.4分から118.5分)でした。全体的にモデルはREMおよび短期睡眠を過小評価し、NREMおよび長期睡眠を過大評価する傾向がありました。

UK Biobankデータを用いた分析

睡眠分類器をUK Biobankの10万人の参加者に適用し、装置で測定した睡眠時間と効率が全原因死亡率とどう関連しているかを調査しました。66,214人の参加者中、1642件の死亡事例が観察されました。短期睡眠者(時間)は、正常睡眠時間(6〜7.9時間)の参加者に比べ、低い睡眠効率(危険比:1.58;95% 信頼区間:1.19から2.11)または高い睡眠効率(危険比:1.45;95% 信頼区間:1.16から1.81)に関係なく、より高い死亡リスクを示しました。

研究結果

研究は、深層学習に基づく睡眠分類技術がPSGと良い一致度を達成できることを示しました。異なる内部および外部検証においても、モデルは一定のロバスト性を示しました。具体的なデータは、短期の夜間睡眠が睡眠連続性に関わらず参加者の全原因死亡リスクを増加させることを示しています。

睡眠パラメータと死亡率の関連性

452,327年的フォローアップの中で、1642件の死亡事例が観察されました。短期睡眠者(時間)は、低睡眠効率(危険比:1.58;95% 信頼区間:1.19から2.11)および高睡眠効率群(危険比:1.45;95% 信頼区間:1.16から1.82)において、死亡リスクが高く、睡眠効率が高いほど死亡リスクが減少する傾向が見られました。

討論と貢献

この研究のユニークな点は、広範な多中心データを利用し、自己監督および深層学習の手法を混合して睡眠分類の正確性を向上させたことです。結果は、短期の夜間睡眠と高い死亡リスクとの関連性を示し、睡眠効率に関係なくこのリスクが確認されました。将来の研究にとって、この方法と結果は、大規模な加速度計データベースにおける睡眠と睡眠構造の研究に新たな方向性を提供します。

これらの研究結果を通じて、研究者たちは深層学習モデルが睡眠分類において有効であることを実証し、短期の夜間睡眠と死亡率の間の明確な関連性を強調しました。この研究は、睡眠監視と健康の関連に関する研究に強力なツールと証拠を提供します。

結論

本論文は、自己監督深層学習法を開発および検証し、加速度計睡眠分類技術を改良し、UK Biobankにおける大規模データを通じてその効果を検証しました。研究は短期の夜間睡眠が健康に大きな影響を与えることを強調し、将来の研究に必要な重要な基礎データと方法論的なサポートを提供しました。

研究の詳細とツール

研究は、自己監督深層学習モデル(sleepnet)を用い、多タスク自己監督学習と循環神経ネットワーク(RNN)による特徴抽出と分類を行いました。これらの方法は英国バイオバンクの70万人のデータで訓練および検証されました。さらに、研究はランダムフォレストモデル(Random Forest)を無標識自由生活データのウィンドウ認識に適用し、分類の正確性をさらに向上させました。

この研究の成果は、将来の大規模な睡眠健康監視および分析の基盤を築き、実用的かつ効率的な方法の革新となります。研究から提供されるオープンソースアルゴリズムと睡眠パラメータは、睡眠および睡眠構造と健康結果との関係の研究を推進し、全体的な健康改善に新たな科学的根拠を提供します。