原発性硬化性胆管炎における制御性T細胞関連遺伝子:メンデルランダム化とトランスクリプトームデータからの証拠
学術的背景
原発性硬化性胆管炎(Primary Sclerosing Cholangitis, PSC)は、免疫、炎症、遺伝的要因が複合的に作用することで引き起こされる慢性進行性の肝疾患であり、最終的には肝不全に至る可能性がある。PSCの発生率と有病率は世界的に大きく異なり、発生率はスペインの0.07例/10万人年からノルウェーの1.3例/10万人年まで、有病率はスペインの0.2例/10万人年から米国の13.6例/10万人年まで幅がある。PSC患者の約70-80%は炎症性腸疾患を併発しており、これは胆管癌や結腸直腸癌のリスク因子でもある。PSCの臨床症状と経過は多様であり、診断は主に胆管画像検査と肝組織病理学に依存している。一部の患者では経過が緩やかであるが、PSCの診断は患者の長期的な健康に重大な影響を及ぼし、移植を必要としない生存期間の中央値は13.2年である。画像技術の進歩により、磁気共鳴画像(MR)などの非侵襲的診断法が内視鏡的逆行性胆管膵管造影(ERCP)や肝生検などの侵襲的手法に取って代わり、PSCの安全かつ正確な診断に用いられている。しかし、現在のところPSCを治療する有効な薬剤はなく、肝移植が唯一の有効な治療法である。したがって、PSCの診断方法の最適化、個別化リスクの決定、治療ターゲットの発見、およびその病態生理学的メカニズムの理解を進めるために、新たなバイオマーカーの発見が急務である。
PSCの病因についてはいくつかの理論があるが、最も広く受け入れられているのは、環境刺激によって引き起こされる免疫介在性疾患であり、遺伝的に感受性のある個体において肝細胞損傷と炎症を引き起こすというものである。これまでの研究では、免疫細胞の浸潤が線維化の進行と胆管細胞の損傷と強く関連していることが示されている。PSC患者の胆管周辺には、好中球やマクロファージなどさまざまな免疫細胞が存在することが確認されている。PSCの特徴の一つはT細胞の浸潤であるが、これらの浸潤性T細胞の組成と機能は異なることが観察されている。例えば、PSC患者の末梢血中のCD4+ T細胞はアポトーシス感受性が低下しているが、CD8+ T細胞にはそのような現象は見られない。また、PSC患者ではCXCR3陽性のCD8+ T細胞の割合が高いが、CD25陽性のCD4+ T細胞の割合は低いことが報告されている。しかし、これらの観察研究は逆因果関係や交絡バイアスの影響を受けやすい可能性がある。したがって、特定の免疫細胞を標的とすることが新しい治療法の発見につながるかどうかを確認するためには、ランダム化比較試験(RCTs)が必要である。RCTsが不足している状況下で、メンデルランダム化(Mendelian Randomization, MR)は、遺伝的変異を道具変数(IVs)として利用することで、曝露と臨床結果の間の因果関係を評価するための重要な技術となっている。
さらに、PSCの研究は以下の理由から制限されている:胆管細胞の取得が困難である、肝臓内のこれらの細胞数が少ない、in vitro培養技術が不安定である、サンプルが進行した患者から採取されることが多い。高スループットRNAシーケンスデータセットの利用可能性は、新たなバイオマーカーを発見するための前例のない機会を提供している。バイオインフォマティクスの発展に伴い、大規模な機械学習アプローチが開発され、特徴変数の選択や予測モデルの構築のための日常的なツールとなっている。現在、Lasso-Coxは大規模な予測シグネチャを生成するための主流のアルゴリズムであるが、特定のモデリング手法の独自性や不適切さにより、いくつかのモデルには重大な欠陥があり、臨床現場での使用が制限されている。したがって、トランスクリプトームデータと先進的な機械学習アルゴリズムを組み合わせてPSCの新たなバイオマーカーを発見する研究はまだ限られている。
研究の目的
本研究は、大規模なゲノムワイド関連研究(GWAS)のサマリーデータ(731の免疫細胞サブタイプと3つのPSC GWASデータセット)、メタ分析、および2つのPSCトランスクリプトームデータを活用し、制御性T細胞(Tregs)の比率の不均衡がPSCの発生において重要な役割を果たすことを明らかにすることを目的としている。その後、研究者は重み付き遺伝子共発現ネットワーク分析(WGCNA)、差異分析、および12の機械学習アルゴリズムの107の組み合わせを使用して、平均曲線下面積(AUC)が0.959の人工知能診断モデル(Tregs分類器)を構築し、検証した。定量的リアルタイムポリメラーゼ連鎖反応(qRT-PCR)により、対照群と比較してPSCマウスモデルにおいてAKAP10、BASP1、DENND3、PLXNC1、およびTMCO3が有意に上方制御され、KLF13およびSCAPの発現レベルが有意に低下していることが確認された。さらに、免疫細胞浸潤および機能エンリッチメント分析により、ハブTregs関連遺伝子がM2マクロファージ、好中球、巨核球-赤芽球前駆細胞(MEP)、自然キラーT細胞(NKT)、およびオートファジー細胞死、補体および凝固カスケード、代謝障害、FcγR媒介食作用、ミトコンドリア機能障害などの経路と有意に関連していることが明らかになり、これらがPSCの発症を媒介している可能性が示された。XGBoostアルゴリズムとShapley加法的説明(SHAP)により、AKAP10およびKLF13が最適な遺伝子として特定され、これらがPSCの重要な治療ターゲットとなる可能性がある。
研究方法
データソース
本研究では、3つの大規模なPSC GWASデータ(GWAS ID: ieu-a-1112, finn-b-k11_cholangi_strict, finn-b-k11_cholangi)を使用し、これらはIEU OpenGWASプロジェクトから取得された。さらに、研究者はGene Expression Omnibus(GEO)データベースから2つのPSC mRNA発現プロファイルデータセット(GSE119600およびGSE159676)をダウンロードした。免疫細胞表現型のGWASサマリーデータはGWASカタログ(accession numbers gcst90001391 to gcst90002121)から取得され、形態学的パラメータ(MP)、相対細胞数(RC)、絶対細胞数(AC)、および表面抗原レベルの蛍光強度(MFI)を含む731の異なる免疫表現型が含まれている。
メンデルランダム化分析
研究者はまず、MR分析を使用して731の免疫細胞とPSCの間の因果関係を確立した。MR分析では、道具変数(IVs)は曝露と強く関連し、他の要因の影響を受けない遺伝的変異である。MR研究の有効性を確保するため、IVsは以下の3つの基準を満たす必要がある:(1)曝露と有意に関連するSNPs(p < 5 × 10^-8またはp < 1 × 10^-5)がIVsとして使用される;(2)独立性の仮定:曝露と結果に関連する重要な交絡因子はSNPs(IVs)と関連しない;(3)排他性の仮定:SNPs(IVs)は曝露を介して結果に直接影響を与え、他の経路を通じて結果と関連しない。
トランスクリプトームデータ分析
研究者はGEOデータベースを系統的に検索し、PSC関連のトランスクリプトームデータセットを選択し、2つのデータセット(GSE119600およびGSE159676)を定量および定性分析に使用した。重み付き遺伝子共発現ネットワーク分析(WGCNA)を使用して、Tregs比率と強く相関する遺伝子モジュールを特定した。その後、差異分析および機械学習アルゴリズムを使用して、Tregs関連遺伝子に基づく診断モデルを構築し、検証した。
機械学習モデルの構築
研究者は、12の古典的な機械学習アルゴリズム(SVM、GBM、LDA、XGBoost、NaiveBayes、RFなど)とその107の組み合わせを統合し、コンセンサス診断モデルを構築した。5分割交差検証を使用して、最終的にLasso+GBMの組み合わせを最適モデルとして選択し、このモデルは2つのPSCコホートで平均AUCが0.959であった。
動物モデルによる検証
研究者はDDC誘導PSCマウスモデルを使用し、qRT-PCRによりTregs関連遺伝子の発現レベルを検証した。結果は、対照群と比較してPSCマウスモデルにおいてAKAP10、BASP1、DENND3、PLXNC1、およびTMCO3が有意に上方制御され、KLF13およびSCAPの発現レベルが有意に低下していることを示した。
研究結果
メンデルランダム化分析の結果
MR分析により、研究者はCD39+静止Treg % CD4 Treg細胞、CD39+分泌Treg細胞上のCD3、およびIgD- CD38dim B細胞上のBAFF-RがPSCリスクと有意に関連していることを発見した。具体的には、CD39+静止Treg % CD4 Treg細胞の増加はPSCリスクを有意に増加させ、CD39+分泌Treg細胞上のCD3はPSCに対して保護効果を示した。
トランスクリプトームデータ分析の結果
GSE119600およびGSE159676データセットでは、PSC群におけるTregsの比率が対照群よりも有意に高かった。WGCNA分析により、研究者はTregs比率と強く相関する遺伝子モジュールを特定し、さらに65のTregs関連遺伝子をスクリーニングした。機械学習アルゴリズムを使用して、研究者は最終的に7つのコアTregs関連遺伝子(AKAP10、BASP1、DENND3、PLXNC1、KLF13、SCAP、およびTMCO3)を特定し、これらの遺伝子に基づく診断モデル(Tregs分類器)を構築した。
動物モデルによる検証結果
PSCマウスモデルにおいて、qRT-PCRにより7つのコアTregs関連遺伝子の発現レベルを検証した。結果は、対照群と比較してPSCマウスモデルにおいてAKAP10、BASP1、DENND3、PLXNC1、およびTMCO3が有意に上方制御され、KLF13およびSCAPの発現レベルが有意に低下していることを示した。
免疫細胞浸潤および機能エンリッチメント分析
免疫細胞浸潤分析により、研究者はPSC患者における好中球およびNKT細胞の比率が有意に増加し、M2マクロファージおよびMEPの比率が有意に減少していることを発見した。機能エンリッチメント分析は、PSCの発生が免疫および炎症関連経路(補体および凝固カスケード、FcγR媒介食作用など)の活性化と強く関連していることを示し、代謝関連経路(胆汁酸代謝、コレステロール代謝など)およびミトコンドリア機能関連経路は有意に下方制御されていることを明らかにした。
研究結論
本研究は、MRとトランスクリプトーム分析を統合し、TregsとPSCの間の因果関係を探る初めての研究である。107の異なる機械学習アルゴリズムの組み合わせを使用して、研究者は7つのTregs関連遺伝子に基づくコンセンサス診断モデル(Tregs分類器)を構築し、検証した。さらに、研究者はM2マクロファージ、MEP、代謝障害、補体および凝固カスケード、ミトコンドリア機能障害、およびAKAP10およびKLF13がPSCの治療において重要なターゲットとなる可能性があることを発見し、PSCの病態生理学的メカニズムに関する新たな洞察を提供した。
研究のハイライト
- 初めてMRとトランスクリプトーム分析を統合:本研究は、MRとトランスクリプトームデータを使用して、TregsとPSCの間の因果関係を系統的に探る初めての研究である。
- 効率的な診断モデルの構築:107の機械学習アルゴリズムの組み合わせを使用して、研究者はTregs関連遺伝子に基づく効率的な診断モデルを構築し、AUCが0.959に達した。
- 新たな治療ターゲットの発見:研究者はAKAP10およびKLF13をPSCの潜在的な治療ターゲットとして特定し、これらがPSCの発生において重要な役割を果たすことを明らかにした。
- PSCの免疫および代謝メカニズムの解明:免疫細胞浸潤および機能エンリッチメント分析を通じて、研究者はPSCの発生における免疫および代謝障害のメカニズムを明らかにし、将来の治療に向けた新たな視点を提供した。
研究の意義
本研究は、PSCの早期診断のための新たなバイオマーカーを提供するだけでなく、Tregs関連遺伝子がPSCの発生において重要な役割を果たすことを明らかにすることで、新たな治療戦略の開発に理論的基盤を提供する。さらに、研究者が構築したTregs分類器は臨床応用において高い診断価値を有し、PSC患者の個別化治療に重要な参考となる可能性がある。