ファジィラフ反復計算モデルによる単細胞RNA-seqデータの遺伝子選択

背景紹介 単細胞RNAシーケンス(single cell RNA-seq, scRNA-seq)技術は、近年、生物医学研究において広く利用されています。この技術は、単一細胞における遺伝子発現の異質性を明らかにし、細胞タイプ、細胞状態、および疾患メカニズムの理解に重要なツールを提供します。しかし、scRNA-seqデータは、サンプルサイズが小さく、高次元で、ノイズが多いという特徴を持っており、クラスタリングや分類の前に遺伝子選択を行うことが必要です。従来の統計分析や機械学習手法は、高次元データを扱う際に「次元の呪い」に直面することが多いため、膨大な遺伝子から代表的な遺伝子を効果的に選択する方法が、現在の研究の焦点の一つとなっています。 この問題を解決するため、本論文の著者らは、ファジィラフ反復...

スプライソソームの忠実性に関する構造的洞察:DHX35–GPATCH1を介した異常スプライシング基質の拒絶

学術的背景紹介 スプライソソーム(spliceosome)は、高度に動的な巨大分子複合体であり、pre-mRNAからイントロン(intron)を正確に切除する役割を担っています。近年、クライオ電子顕微鏡(cryo-electron microscopy, cryo-EM)技術を通じて、科学者たちはスプライソソームの段階的な組み立て、触媒的スプライシング、そして最終的な解離過程についてかなり詳細な構造的理解を得てきました。しかし、スプライソソームがどのようにして最適でないスプライシング基質を認識し、拒絶するのかという分子メカニズムはまだ不明です。この問題は、スプライシングの忠実性(splicing fidelity)を理解する上で極めて重要です。なぜなら、スプライシングのエラーは遺伝子発現の異...

非カノニカルプロテオームの包括的発見と機能特性

学術的背景 ヒトゲノムプロジェクト(Human Genome Project)の完了は、複雑な生物学的プロセスに対する全ゲノムレベルの理解を大きく進展させました。しかし、ゲノムのうち約1%しかタンパク質をコードしておらず、残りの大部分は非コード領域であり、長鎖非コードRNA(lncRNA)などの非コードRNA(ncRNA)を大量に生成しています。近年、これらの非コードRNAが新規ペプチドをコードし、細胞活動において重要な役割を果たす可能性があることが多くの研究で示されています。例えば、特定のlncRNAがコードするペプチドは、筋肉の生理機能、代謝調節、免疫応答などのプロセスで重要な役割を担っています。しかし、技術的な制限により、これらの非古典的翻訳産物(新規ペプチドなど)の体系的識別と機能の...

TP53特異的変異が乳癌の相同組換え欠損の潜在的なバイオマーカーとして機能する:臨床次世代シーケンス研究

乳がんは、世界中の女性において最も一般的な悪性腫瘍の一つであり、その発症メカニズムは複雑で、さまざまな遺伝子変異とシグナル伝達経路の異常が関与しています。相同組換え欠損(Homologous Recombination Deficiency, HRD)は、乳がんにおける重要な分子特徴の一つであり、PARP阻害剤(PARPi)治療に対する患者の感受性と密接に関連しています。HRDは通常、BRCA1/2遺伝子の変異によって引き起こされますが、近年の研究では、他の遺伝子の変異もHRDを引き起こす可能性が示されています。TP53遺伝子は、乳がんにおいて最も頻繁に変異する遺伝子の一つであり、細胞周期制御、DNA修復、ゲノム安定性において重要な役割を果たしています。しかし、TP53変異とHRDとの関係は...

前蛋白変換酵素FurinがTGF-βシグナル伝達を損なう新しい動脈瘤感受性遺伝子として

学術的背景 大動脈瘤(Aortic Aneurysm, AA)は大動脈の異常拡張を特徴とする疾患で、腹部大動脈と胸部大動脈に多く見られます。大動脈瘤は65歳以上の人口において発症率が高く、適切な診断と治療が行われない場合、致命的な破裂を引き起こす可能性があります。年齢、喫煙、高血圧、男性性別は重要なリスク要因とされていますが、これらの要因は必要でも十分でもなく、遺伝的素因が疾患の発症に重要な役割を果たしていることが示唆されています。現在、ほとんどの大動脈瘤症例、さらには家族性大動脈瘤においても、既知の病因遺伝子変異は見つかっていません。非選択的腹部大動脈瘤患者の約2%、非選択的胸部大動脈瘤患者の約5%が既知の大動脈瘤遺伝子に(おそらく)病原性変異を有しているに過ぎません。これは、ほとんどの大...

スケール空間における有意性を基にしたHi-Cデータ分析

ゲノミクス分野において、ゲノムの空間的構造を理解することは、遺伝子制御メカニズムを解明する上で極めて重要です。Hi-C技術は、全ゲノム染色体構造捕捉技術として、ゲノムの三次元構造を明らかにするものであり、特にクロマチンループ(chromatin loops)が遺伝子制御において重要な役割を果たしています。しかし、既存のHi-Cデータ解析手法は、共有されるクロマチンループを識別することはできるものの、細胞タイプ特異的なクロマチンループを検出することは困難です。これにより、異なる細胞タイプにおける遺伝子制御メカニズムの理解が制限されています。この問題を解決するため、Rui Liuらは、SSSHiC(Significance in Scale Space for Hi-C Data)と呼ばれる新し...

非コードRNAの分類とクラス注釈のための多モーダル解釈可能表現

非コードRNA(ncRNA)は、細胞プロセスや疾患の発症において重要な役割を果たしています。ゲノムシーケンシングプロジェクトによって大量の非コード遺伝子が明らかになりましたが、ncRNAの機能と分類は依然として複雑で挑戦的な問題です。ncRNAの多様性、複雑性、および機能性は、バイオマーカーや治療ターゲットの発見において、特に生物医学研究の重要な対象となっています。しかし、既存のncRNA分類ツールの多くは、単一または2種類のデータタイプ(例えば配列や二次構造)に依存しており、他の重要な情報源を無視しています。さらに、既存の手法は解釈可能性に欠けることが多く、異なるncRNAクラスの特徴を明らかにするのが困難です。 これらの問題を解決するため、Université Paris-Saclayと...

マルチキー準同型暗号によるゲノム計算のプライバシー保護フレームワーク

ゲノム解析のプライバシー保護フレームワーク:マルチキー準同型暗号に基づく研究 学術的背景 ゲノムシーケンスのコスト低下により、ゲノムデータの広範な利用可能性は、個別化医療(ゲノム医療とも呼ばれる)に新たな可能性をもたらしました。しかし、ゲノムデータには疾患の感受性、祖先情報、身体的特徴などの機密情報が含まれており、これらのプライバシー問題は医学研究とデータ共有における重大な障壁となっています。これまでに研究者たちはさまざまなプライバシー保護技術を提案してきましたが、既存の暗号ベースの手法は相互運用性、拡張性、プライバシー保護レベル、および複数者分析のサポートにおいて依然として課題を抱えています。これらの制限はゲノムデータの潜在能力を制約し、医学研究への応用を妨げています。そのため、プライバシ...

Transformerモデルを用いたDNA配列アラインメントの研究

学術的背景 DNAシーケンスアラインメントは、ゲノム解析における中心的な課題であり、短いDNA断片(リード)を参照ゲノム上の最も可能性の高い位置にマッピングすることを目的としています。従来の方法は通常、2つのステップに分かれています。まずゲノムをインデックス化し、次に効率的な検索を行ってリードの可能性のある位置を特定します。しかし、ゲノムデータの爆発的な増加、特に数十億塩基対の参照ゲノムを扱う場合、従来のアラインメント方法は計算効率と精度の面で大きな課題に直面しています。近年、Transformerモデルが自然言語処理(NLP)分野で成功を収めたことから、研究者はこれをDNAシーケンス解析に応用しようとしています。これまでの研究では、Transformerモデルが短いDNAシーケンスの分類タ...

SCICONE:単細胞コピー数変異とイベント履歴の再構築

腫瘍の進化過程において、ゲノムコピー数変異(Copy Number Alterations, CNAs)は腫瘍の異質性と進化を駆動する重要な要因です。これらの変異を理解することは、個別化されたがん診断や治療法の開発にとって極めて重要です。単一細胞シーケンス技術は、単一細胞レベルまで深く分析できる最高解像度のコピー数解析を提供します。しかし、低リード深度(low read-depth)の全ゲノムシーケンスデータは、コピー数変異の検出に大きな統計的および計算上の課題をもたらします。既存の計算方法の多くは細胞間の進化的関係を無視しており、その結果、検出精度が低下しています。そのため、細胞の進化歴史を組み込んだコピー数検出方法の開発が現在の研究における緊急の課題となっています。 論文の出典 本論文は...