非コードRNAの分類とクラス注釈のための多モーダル解釈可能表現

非コードRNA(ncRNA)は、細胞プロセスや疾患の発症において重要な役割を果たしています。ゲノムシーケンシングプロジェクトによって大量の非コード遺伝子が明らかになりましたが、ncRNAの機能と分類は依然として複雑で挑戦的な問題です。ncRNAの多様性、複雑性、および機能性は、バイオマーカーや治療ターゲットの発見において、特に生物医学研究の重要な対象となっています。しかし、既存のncRNA分類ツールの多くは、単一または2種類のデータタイプ(例えば配列や二次構造)に依存しており、他の重要な情報源を無視しています。さらに、既存の手法は解釈可能性に欠けることが多く、異なるncRNAクラスの特徴を明らかにするのが困難です。 これらの問題を解決するため、Université Paris-Saclayと...

遺伝子型-表現型ダイナミクスのマッピングのための多モーダル学習

多モーダル学習による遺伝子型と表現型の動的関係の解明 背景紹介 遺伝子型と表現型の複雑な関係は、生物学分野の核心的な問題の一つである。遺伝子型(genotype)は生物体の遺伝情報を指し、表現型(phenotype)はこれらの遺伝情報が特定の環境下でどのように表れるかを指す。1909年にWilhelm Johannsenがこれら二つの用語を提唱し、その関係を定量化しようと試みたが、一世紀以上経った現在でも、遺伝子型がどのように複雑な遺伝子発現パターンを通じて表現型を形作るかを正確に記述することはできていない。近年、単一細胞RNAシーケンシング(single-cell RNA sequencing, scRNA-seq)などの技術の発展により、細胞解像度で遺伝子発現の複雑なダイナミクスを観察す...