DeepRNA-Twist:言語モデル誘導型RNAねじれ角予測とアテンション-インセプションネットワーク

一、学術的背景と研究動機 生命科学およびバイオインフォマティクスの急速な発展に伴い、RNA分子構造とその機能に関する研究はホットな分野となっている。RNAは単なる遺伝情報の伝達者に留まらず、調節・触媒など数多くの生理過程で重要な役割を果たしている。RNA分子の三次元構造はその生物学的機能に直接影響し、RNA構造の精密な解析は基礎科学、創薬、疾患メカニズム研究などにとって極めて重要である。しかし、RNAの配列から構造への変換はタンパク質よりもはるかに複雑であり、RNAの骨格には7つの主鎖ねじれ角(α, β, γ, δ, ε, ζ, χ)があり、さらに複雑な擬似ねじれ角(η, θ)や非標準塩基対、多重ループ、三重相互作用など多様な構造要因が加わることで、高精度なRNA三次元構造予測が非常に困難と...

Chrombus-XMBD:染色質特徴に基づく3Dゲノム予測グラフ畳み込みモデル

研究背景と学問的意義 真核細胞内において、クロマチン(Chromatin)の三次元空間構造は、遺伝子発現の制御に極めて重要な役割を果たしています。DNAは複雑な折りたたみやループ形成、局所的な空間再構築を通じて、異なる遺伝子要素(プロモーターpromoterやエンハンサーenhancerなど)が空間的に隣接し、精巧なシス(cis)制御を実現します。近年、発生生物学、疾患メカニズム、またはエピゲノム研究の分野で、三次元ゲノム(3D-genome)の動的構造が遺伝子発現の変化と密接に関連していることが繰り返し証明されています。 現在、ゲノム空間構造を捉える主な実験手法には、3C、4C、5C、Hi-C、ChIA-PET、HiChIPなどがあります。しかし、これらの実験手法はコストが高く、操作が複雑...

行列補完に基づくアンサンブル学習による微生物-疾患関連予測の改善

学術的背景と研究課題 微生物は地球上で最も広く存在する生命体の一つであり、海洋や土壌、そして人間そのものとも密接に関わっています。人体には約350兆個の微生物細胞(microbial cells)が存在しており、健康や病気の発症・進展と密接な関係を持っています。近年、シーケンシング技術とバイオインフォマティクスの急速な発展により、人体の微生物叢(microbiome)構成やその機能が健康に与える影響を明らかにする研究が数多くなされています。例えば、腸内細菌叢の構成変化は免疫系や疾患発症に影響を与え、肝臓の代謝も腸内微生物の調節を受け、エネルギー消費の低下や脂肪蓄積の促進などを介して代謝疾患の進展に寄与することが証明されています。 実験バイオ医学は微生物―疾患(microbe-disease)...

HSSPPI: 階層的および空間的シーケンシャルモデリングによるPPI予測

背景紹介:タンパク質間相互作用予測のボトルネックと機会の解明 タンパク質(Protein)は生命活動の中心分子として、遺伝子発現、RNA転写、DNA合成、免疫反応など、ほぼすべての生物学的プロセスや細胞機能に関与しています。タンパク質分子同士の相互作用(Protein-Protein Interactions, PPI)、および特定部位での相互作用(Protein-Protein Interaction Sites, PPIS)は、多様かつ精緻な生理活動を決定づけます。例えば、創薬、タンパク質機能アノテーション、疾患分子メカニズムの探究、グローバルなタンパク質間相互作用ネットワークの構築などは、すべて高品質なPPIおよびPPIS情報を基盤としています。 しかし、従来の生物学実験(X線結晶構造...

MAEST: グラフマスクオートエンコーダーを用いた空間トランスクリプトミクスにおける正確な空間領域検出

空間トランスクリプトミクス――組織空間ヘテロジニティ解析の最前線技術 空間トランスクリプトミクス(Spatial Transcriptomics, ST)は、近年急速に発展しているシーケンシング技術であり、その核心は組織スライスレベルで遺伝子発現と空間位置情報の両方を同時に取得できる点にあります。これにより、多細胞生物組織の空間構造、機能分区、および疾患マイクロ環境の解明に前例のないデータ基盤を提供します。10x Visium、Slide-seq、Stereo-seq、seqFISH、MERFISHといったプラットフォーム技術の進展に伴い、科学者たちは高解像度で空間的にトラッキング可能な大規模遺伝子発現データを取得でき、発生生物学、神経科学、腫瘍生物学などの分野の発展に大きく寄与しています。...

TopoQA: トポロジカルディープラーニングに基づくタンパク質複合体構造インターフェース品質評価アプローチ

学術的背景 タンパク質複合体の三次元構造解析は、現代の構造生物学、分子機構の研究、創薬、さらに人工タンパク質設計など多岐にわたる分野の核心的な課題である。タンパク質の機能はしばしばその構造によって決定されるが、多くの生物学的プロセスはタンパク質間の複雑な相互作用に関与している。従来の実験的手法(X線結晶構造解析、クライオ電子顕微鏡、NMRなど)はタンパク質の三次元構造を決定できるが、時間とコストがかかり、高スループットまたは大規模研究には不向きである。近年、データ駆動型のタンパク質構造予測手法(AlphaFold, RoseTTAFold等)が革命的な成果を挙げ、特に単体タンパク質モデルの精度は実験構造に匹敵するまでになった。しかし、タンパク質複合体の構造予測精度は単体ほど高くなく、とくに多...

Granger因果リカレントオートエンコーダーによる時系列単細胞RNAシーケンスデータからの遺伝子制御ネットワークの推論

1. 学術的背景と研究動機 近年、シングルセルRNAシーケンシング(single-cell RNA sequencing、scRNA-seq)は、生命科学および医学研究分野における画期的な技術の一つとなっており、研究者は細胞単位で多くの細胞間の転写レベルの微妙な差異を捉えることが可能となっています。この技術は細胞生物学を大いに豊かにし、細胞分化、発生、疾患発症メカニズムの理解に重大な意義を持ちます。scRNA-seqデータに基づき、遺伝子調節ネットワーク(gene regulatory networks, GRNs)を推定し、転写因子と標的遺伝子間の複雑な調節関係を明らかにすることは、現在のバイオインフォマティクスやシステムバイオロジーの中でも鍵となる課題です。 しかし、scRNA-seqデ...

Cox-SAGE:解釈可能なグラフニューラルネットワークを用いたCox比例ハザードモデルの強化とがん予後への応用

一、研究背景と学問的最前線 がん予後解析は、医学分野の中核的な研究テーマであり続けています。近年、ハイスループットシーケンシング技術(high-throughput sequencing technologies)が広く応用されたことで、科学者たちはがん患者の分子バイオマーカー(biomarker)や臨床的特徴をより深く探求できるようになりました。これにより、臨床医は患者の生存リスクをより正確に評価し、個別化された治療戦略を立てることが可能になりました。伝統的なCox比例ハザードモデル(Cox proportional hazards model)は、生存解析の古典的ツールとしてその優れた統計的基盤と適応性の高さから、がん予後研究で広く利用されています。 しかし、深層学習(Deep Lear...

モジュール応答分析のテストと限界の克服

研究背景:ネットワーク推定の新たな挑戦 現代の分子生物学およびシステム生物学の分野において、生体分子ネットワーク(遺伝子制御ネットワーク、タンパク質相互作用ネットワーク、シグナル伝達ネットワークなど)の高精度な解析は、細胞の生命活動、疾患発症機構、薬剤作用機序の理解にとって中核的な位置を占めています。しかし、これらの生体ネットワークは極めて複雑であり、ノードが多数、結合関係が錯綜し、強い非線形ダイナミクスや実験測定ノイズが多いという課題が普遍的に存在します。著者らはこうした背景の下、「モジュラー応答解析(Modular Response Analysis, MRA)」に着目しました。MRAは、系のノードに摂動を加え、その応答を解析してモジュール間の相互作用を推定する古典的手法であり、“遺伝子...

連続結果の回帰モデリングにおけるランダムフォレスト変数選択方法の比較

背景紹介:機械学習回帰モデルにおける変数選択の重要性 近年、機械学習はバイオインフォマティクスおよびデータサイエンス分野で広く応用され、予測モデリングの発展を大きく促進しています。ランダムフォレスト(Random Forest、RF)回帰は一般的なアンサンブル学習アルゴリズムとして、予測精度やモデルの堅牢性を効果的に高めることができ、連続型アウトカムの予測モデルを構築する上で重要なツールとなっています。しかし、高次元データに直面した場合、モデル内の予測変数が多いほど必ずしも予測性能の向上につながるわけではなく、むしろ情報の冗長化やモデルの過学習、実際の応用時の利便性の低下につながる可能性があります。したがって、「変数選択(Variable Selection/Feature Selectio...