単細胞RNAシーケンスデータの空間再構築のための対照的マッピング学習
単細胞RNAシーケンス(scRNA-seq)技術は、単細胞解像度で高スループットなトランスクリプトーム解析を可能にし、細胞生物学の研究を大きく進展させました。しかし、scRNA-seq技術の重要な制約は、組織を解離する必要があるため、細胞の組織内における元の空間位置情報が失われることです。空間トランスクリプトミクス(Spatial Transcriptomics, ST)技術は、正確な空間遺伝子発現マップを提供できますが、遺伝子検出数、コスト、細胞タイプ注釈の細かさにおいて制限があります。そのため、scRNA-seqデータに空間情報を復元する方法は、現在の研究における重要な課題となっています。
この問題を解決するため、研究者たちは、scRNA-seqとSTデータの間で知識を転送する「細胞対応学習(cell correspondence learning)」を提案し、scRNA-seqデータの空間情報を復元する方法を模索しています。しかし、既存の方法は、局所的および全体的な関係のモデル化、細胞タイプ情報の統合などに欠点があり、空間マッピングの精度が限られています。
論文の出典
この論文は、香港城市大学、汕頭大学、汕頭大学医学院、華南理工大学の研究チームによって共同で執筆されました。主な著者にはXindian Wei、Tianyi Chen、Xibiao Wangなどが含まれ、共著者として汕頭大学のCheng Liuと香港城市大学のHau-San Wongが名を連ねています。論文は2025年2月24日に『Bioinformatics』誌に掲載され、タイトルは「COME: Contrastive Mapping Learning for Spatial Reconstruction of Single-Cell RNA Sequencing Data」です。
研究の流れと結果
研究の流れ
COMEメソッドの核心は、コントラスティブラーニングフレームワーク(contrastive learning framework)を用いて、scRNA-seqとSTデータの間のマッピング関係を確立し、scRNA-seqデータの空間情報を復元することです。研究の流れは以下のステップで構成されています:
データ前処理
研究では、3つの異なる生物システム(ショウジョウバエ胚、マウス初代視覚皮質、ヒト膵臓癌)から得られたscRNA-seqとSTデータセットを使用しました。まず、データを標準化し、各細胞の総遺伝子発現量を一致させました。次に、scRNA-seqとSTデータに共通する遺伝子を選択し、2つのデータモダリティを整列させました。細胞対応学習
研究では、共有オートエンコーダー(autoencoder)を使用して、scRNA-seqとSTデータの潜在表現を抽出しました。scRNA-seqデータの潜在コードをデコードすることで、再構築された空間データを生成しました。さらに、係数層(coefficient layer)を導入し、scRNA-seqから空間領域へのマッピングを学習しました。係数行列(coefficient matrix)は、細胞と空間スポット間の関連強度を捉えるために使用されました。コントラスティブラーニングモジュール
潜在特徴表現の識別能力を高めるため、コントラスティブラーニングモジュールを設計しました。このモジュールは、細胞タイプコントラスティブラーニング(cell-type contrastive learning)とクロスモダリティコントラスティブラーニング(inter-contrastive learning)を含みます。細胞タイプコントラスティブラーニングは、scRNA-seqデータの細胞タイプ情報を利用し、同じタイプの細胞を潜在空間でより近づけます。クロスモダリティコントラスティブラーニングは、マッピング行列を通じて、scRNA-seqとSTデータの潜在特徴表現をより一致させます。最適化と評価
研究者たちは、再構築損失、係数正則化損失、構造的類似性正則化損失を組み合わせてネットワークモデルを最適化しました。最終的に、scRNA-seq細胞の空間位置を予測することで、COMEメソッドの有効性を検証しました。評価指標には、ピアソン相関係数(PCC)、構造的類似性指数(SSIM)、平均二乗誤差(RMSE)などが含まれます。
主な結果
空間遺伝子再構築
ショウジョウバエ胚のデータを用いた実験では、COMEメソッドが空間遺伝子発現の再構築において他の方法を大幅に上回ることが示されました。COMEのPCC中央値は他の方法よりも有意に高く、特に明確な空間的特徴を持つ遺伝子(例:twi、ftz、cg11208)の再構築において優れた性能を発揮しました。細胞解像度空間トランスクリプトミクスデータ分析
マウス初代視覚皮質のデータを用いた実験では、COMEメソッドが遺伝子の空間パターン予測において優れた結果を示しました。特にSTARmapデータセットでは、COMEのPCC中央値が0.233に達し、2番目に優れた方法よりも12%向上しました。さらに、COMEはグルタミン酸作動性ニューロン(glutamatergic neurons)の組織内階層分布を正確に推測し、以前の研究結果と一致しました。空間デコンボリューション
ヒト膵臓癌のデータを用いた実験では、COMEメソッドが癌領域と非癌領域の細胞タイプ分布を正確に区別することができました。COMEは腫瘍微小環境(TME)における主要な細胞タイプの位置を正確に予測し、マーカー遺伝子の発現パターンと高い一致を示しました。一方、他の方法(例:TangramやGraphST)は、癌領域と非癌領域の区別において劣っていました。
結論と意義
COMEメソッドは、コントラスティブラーニングフレームワークを通じて、scRNA-seqデータの空間情報を効果的に復元し、複数の生物システムでその正確性と汎用性を検証しました。この方法は、空間遺伝子発現パターンを再構築するだけでなく、細胞タイプの組織内分布を推測するための重要なツールを提供し、細胞間の相互作用と機能を理解するのに役立ちます。
研究のハイライト
コントラスティブラーニングフレームワーク
COMEメソッドは、scRNA-seqとSTデータのマッピング学習に初めてコントラスティブラーニングを導入し、空間再構築の精度を大幅に向上させました。細胞タイプ情報の統合
細胞タイプコントラスティブラーニングを通じて、COMEメソッドは類似した細胞タイプ間の空間依存関係をより良く捉え、モデルの生物学的意義を強化しました。広範な応用価値
COMEメソッドは、複数の生物システムで成功を収め、特に腫瘍微小環境や神経科学研究における空間トランスクリプトミクス研究の広範な可能性を示しました。
その他の有用な情報
COMEメソッドのコードはGitHubでオープンソースとして公開されています(https://github.com/cindyway/come)。研究者は自由にダウンロードして使用することができます。さらに、研究チームは詳細なデータ前処理と評価プロセスを提供しており、他の研究者がこの研究を再現および拡張するのに役立ちます。
この論文は、単細胞トランスクリプトミクスデータの空間再構築に新しい視点と方法を提供し、重要な科学的価値と応用の可能性を持っています。COMEメソッドを通じて、研究者は細胞の組織内における空間分布と機能をより深く理解し、疾患研究と治療に新しいツールを提供することができます。