CellMincerを使用した電圧イメージングデータのロバストな自己教師付きノイズ除去

学術的背景

電圧イメージング(voltage imaging)は、神経活動を研究するための強力な技術ですが、その有効性は低い信号対雑音比(SNR)によって制限されることが多いです。従来のノイズ除去方法、例えば行列分解は、ノイズと信号構造について厳密な仮定を課しますが、既存の深層学習アプローチは、電圧イメージングデータに固有の高速なダイナミクスと複雑な依存関係を完全に捉えることができませんでした。これらの問題を解決するために、本論文ではCellMincerという新しい自己教師あり深層学習手法を提案し、電圧イメージングデータセットのノイズ除去に特化しています。CellMincerは、短時間ウィンドウ内のスパースなピクセルセットをマスクして予測し、事前計算された時空間自己相関を組み合わせることで、長距離依存関係を効果的にモデル化し、ノイズ除去性能を大幅に向上させます。

電圧イメージングは、蛍光レポーター(例えば小分子染料や遺伝子コード化されたタンパク質)を使用して、電気的に活性な細胞の膜電位を測定します。従来のパッチクランプ電気生理学(patch-clamp electrophysiology, EP)と比較して、電圧イメージングはより高いスループットと低い侵襲性を提供します。しかし、染料の量子収率、短い露光時間(<2ms)、および励起強度の制限により、電圧イメージングのSNRは依然として低く、閾値以下のシナプス後電位などの小さな電気的イベントが背景ノイズに埋もれてしまう可能性があり、神経回路の形成やシナプス可塑性の理解に影響を与えます。

論文の出典

本論文は、Brice WangTianle MaTheresa ChenTrinh NguyenEthan CrouseStephen J. FlemingAlison S. WalkerVera ValakhRalda NehmeEvan W. MillerSamouil L. Farhi、およびMehrtash Babadiによって共同執筆されました。著者は、Broad Institute of MIT and HarvardOakland UniversityUC Berkeleyなどの機関に所属しています。論文は2024年にnpj Imaging誌に掲載されました。

研究の流れ

1. データの前処理とグローバル特徴抽出

CellMincerのノイズ除去プロセスは、データの前処理、自己教師あり事前学習、およびノイズ除去推論の3つの段階で構成されています。前処理段階では、研究者は電圧イメージングデータを3次元テンソル(時間×幅×高さ)として表現し、各ピクセルの時系列に対して低次の多項式フィッティングを行い、平滑化されたトレンドとトレンド除去された残差テンソルに分解します。平滑化されたトレンドテンソルは主に背景蛍光を表し、トレンド除去された残差テンソルは電気活動のノイズ測定を表します。このステップにより、研究者は信号に関係のない背景ノイズを除去し、モデルの性能を向上させることができます。

2. 自己教師あり事前学習

自己教師あり事前学習段階では、CellMincerはマスクとスパースなピクセルセットの予測を通じて学習を行います。具体的には、研究者はフレーム内のピクセルをランダムに選択し、ガウシアンノイズで置き換え、その後ニューラルネットワークを訓練して、残りのピクセルからこれらのマスクされたピクセル値を予測します。この学習戦略により、モデルはクリーンなターゲットデータを使用せずにノイズ除去を行うことができ、従来の教師あり学習手法がクリーンデータに依存する問題を回避します。

3. ノイズ除去推論

推論段階では、CellMincerはトレンド除去されたムービーデータをニューラルネットワークに入力し、スライディングウィンドウ方式で各ウィンドウの中間フレームをノイズ除去します。切り捨てられた結果を避けるために、研究者はトレーニングと推論時に適切な空間パディングを入力データに適用し、ノイズ除去されたムービーの最初と最後にτフレームのコピーを追加します。

4. 物理ベースのシミュレーションフレームワーク

CellMincerのアーキテクチャとハイパーパラメータを最適化するために、研究者はOptoSynthという物理ベースのシミュレーションフレームワークを開発し、高度に現実的な合成電圧イメージングデータセットを生成しました。OptoSynthは、ニューロンの形態再構築とパッチクランプ電気生理学測定をシミュレートし、ノイズのない電圧イメージングデータを生成し、ポアソンノイズとガウスセンサー熱ノイズを追加して現実的なノイズデータを生成します。これらの合成データは、厳密なハイパーパラメータ最適化とアブレーション研究に使用され、事前計算された時空間自己相関がノイズ除去において重要な役割を果たすことを明らかにしました。

主な結果

1. ノイズ除去性能

CellMincerは、シミュレーションおよび実データセットでの包括的なベンチマークテストにおいて、SNRゲイン、高周波ノイズの低減、閾値以下のイベント検出、および電気生理信号の復元において優れた性能を示しました。既存の手法と比較して、CellMincerはSNRゲインで0.5-2.9 dBの向上を達成し、SNRの変動性を17-55%低減しました。特に、高周波ノイズ(>100Hz)において、CellMincerは14 dBのノイズ低減を実現し、次善の手法よりも3-10.5 dBさらに低減しました。

2. 閾値以下のイベント検出

実電圧イメージングデータにおいて、CellMincerは閾値以下のイベント検出精度を大幅に向上させました。ベンチマーク手法と比較して、CellMincerは0.5-10 mVの範囲で閾値以下のイベント検出F1スコアを2-6ポイント向上させました。さらに、CellMincerは低ノイズ電気生理記録と電圧イメージング間の相互相関を8%向上させました。

3. ニューロンセグメンテーションと機能表現型の識別

CellMincerの導入により、ニューロンセグメンテーション、ピーク検出、および機能表現型の識別が大幅に改善されました。慢性テトロドトキシン(TTX)処理および未処理のhPSC由来ニューロンの電圧イメージングにおいて、CellMincerによるノイズ除去により、生データと比較してほぼ2倍のニューロンを識別し、2つの機能表現型間の統計的分離を大幅に強化しました。

結論

CellMincerは、電圧イメージングデータセットのノイズ除去に特化した自己教師あり深層学習手法であり、マスクとスパースなピクセルセットの予測、事前計算された時空間自己相関の組み合わせにより、ノイズ除去効果を大幅に向上させます。シミュレーションおよび実データセットでの性能は既存の手法を上回り、特にSNRゲイン、高周波ノイズの低減、および閾値以下のイベント検出において優れた結果を示しました。CellMincerの導入は、電圧イメージングデータの品質を向上させるだけでなく、神経回路研究やシナプス可塑性分析のための新しいツールを提供します。

研究のハイライト

  1. 革新的な手法:CellMincerは、自己教師あり学習と事前計算された時空間自己相関を組み合わせることで、電圧イメージングデータのノイズ除去効果を大幅に向上させました。
  2. 広範な適用性:CellMincerは、シミュレーションおよび実データセットでの性能が既存の手法を上回り、特に高周波ノイズの低減と閾値以下のイベント検出において優れた結果を示しました。
  3. 実用的な価値:CellMincerの導入により、ニューロンセグメンテーション、ピーク検出、および機能表現型の識別が大幅に改善され、神経回路研究やシナプス可塑性分析のための新しいツールを提供します。

その他の価値ある情報

CellMincerのコードリリースは、使いやすさと展開の容易さに重点を置いて設計されており、さまざまな診断フィードバックメカニズムを提供し、安定したDockerイメージを公開しています。さらに、研究者は事前学習済みのCellMincerモデルを提供しており、この手法の使用にかかる計算コストをさらに削減しています。