EPICPred:注意ベースのマルチインスタンス学習を用いたエピトープ結合TCR駆動型表現型の予測

T細胞受容体(TCR)は適応免疫システムにおいて重要な役割を果たしており、特定の抗原エピトープ(epitope)に結合することで病原体を認識します。TCRとエピトープ間の相互作用を理解することは、免疫応答の生物学的メカニズムを解明し、T細胞を介した免疫療法を開発する上で極めて重要です。しかし、TCRのCDR3領域がエピトープ認識において重要であることは広く認められているものの、特定の疾患や表現型に関連するTCR-エピトープ相互作用を正確に予測する方法は依然として課題となっています。この問題に対処するため、研究者たちはEpicPredを開発しました。これは注意メカニズムに基づく多インスタンス学習(Multiple Instance Learning, MIL)モデルであり、がんやCOVID-1...

DeepES: ディープラーニングに基づく酵素スクリーニングによるオーファン酵素遺伝子の特定

学術的背景 シーケンシング技術の急速な進展により、科学者たちは大量のタンパク質配列データを取得できるようになり、その中には多くの酵素配列も含まれています。しかし、京都遺伝子とゲノム百科事典(KEGG)やBRENDAのような大規模な酵素データベースが構築されているにもかかわらず、多くの酵素の配列情報は依然として欠落しています。これらの配列情報が欠如している酵素は「オーファン酵素」(orphan enzymes)と呼ばれています。オーファン酵素の存在は、配列類似性に基づく機能アノテーションを著しく妨げ、配列と酵素反応の間の関係を理解する上で大きな空白を生んでいます。 オーファン酵素の問題は、配列情報の欠如に限らず、生物学的プロセスの理解にも影響を及ぼしています。例えば、ヒト腸内細菌叢における多く...

MostPlas: プラスミド宿主範囲予測のための自己修正多ラベル学習モデル

プラスミド(plasmid)は、細菌の染色体DNAとは独立した小型の環状二本鎖DNA分子であり、水平遺伝子伝達(horizontal gene transfer)を通じて宿主細菌が抗生物質耐性や金属耐性などの有益な特性を獲得するのを助けます。一部のプラスミドは、複数の微生物間で転移、複製、または持続することが可能であり、これらは広宿主範囲プラスミド(broad-host-range plasmids, BHR plasmids)と呼ばれます。BHRプラスミドの宿主範囲を正確に予測することは、プラスミドがどのように細菌の進化を促進し、耐性遺伝子を広めるかを理解するだけでなく、組換えベクターの開発においても重要な意義を持ちます。しかし、現在のところ、BHRプラスミドの詳細な宿主範囲ラベルを提供す...

SCICONE:単細胞コピー数変異とイベント履歴の再構築

腫瘍の進化過程において、ゲノムコピー数変異(Copy Number Alterations, CNAs)は腫瘍の異質性と進化を駆動する重要な要因です。これらの変異を理解することは、個別化されたがん診断や治療法の開発にとって極めて重要です。単一細胞シーケンス技術は、単一細胞レベルまで深く分析できる最高解像度のコピー数解析を提供します。しかし、低リード深度(low read-depth)の全ゲノムシーケンスデータは、コピー数変異の検出に大きな統計的および計算上の課題をもたらします。既存の計算方法の多くは細胞間の進化的関係を無視しており、その結果、検出精度が低下しています。そのため、細胞の進化歴史を組み込んだコピー数検出方法の開発が現在の研究における緊急の課題となっています。 論文の出典 本論文は...

FlowPacker: トーショナルフローマッチングを用いたタンパク質側鎖パッキング

タンパク質の三次元構造はそのアミノ酸配列によって決定され、タンパク質の機能はその三次元構造に大きく依存しています。タンパク質の側鎖構造(side-chain conformations)は、タンパク質の折り畳み、タンパク質-タンパク質相互作用、およびタンパク質設計(de novo protein design)において重要な役割を果たします。正確にタンパク質側鎖の構造を予測することは、タンパク質の折り畳みメカニズムを理解し、新しいタンパク質を設計し、タンパク質相互作用を研究するための鍵となります。しかし、従来の物理ベースのモデル(physics-based modeling)は、経験的なスコアリング関数(empirical scoring functions)、離散的なロタマーライブラリ(d...

トランスフォーマーを用いたCryo-EM密度マップの効率的な強化

学術的背景 低温電子顕微鏡(Cryo-EM)は、タンパク質などの巨大分子の構造を解析するための重要な実験技術です。しかし、Cryo-EMの有効性は、低コントラストや構造の異質性などの実験条件によって引き起こされるノイズや密度値の欠損によってしばしば制限されます。既存のグローバルおよびローカルな画像シャープニング技術はCryo-EM密度マップの改善に広く使用されていますが、より正確なタンパク質構造を構築するためにその品質を効率的に向上させることには依然として課題があります。この問題を解決するために、研究者はCryoTenという3D UNETR++スタイルのTransformerモデルを開発し、Cryo-EM密度マップの品質を効果的に向上させることを目指しています。 論文の出典 この論文は、Jo...

GCLink:遺伝子調節ネットワーク推論のためのグラフコントラストリンク予測フレームワーク

研究背景 遺伝子制御ネットワーク(Gene Regulatory Networks, GRNs)は、細胞内の複雑な生物学的プロセスを理解するための重要なツールです。それは転写因子(Transcription Factors, TFs)と標的遺伝子間の相互作用を明らかにし、遺伝子の転写プロセスを制御し、細胞の挙動を調節します。単細胞RNAシークエンシング(single-cell RNA-sequencing, scRNA-seq)技術の発展により、研究者は単細胞解像度で遺伝子発現データを取得できるようになり、これがGRNsの推論に前例のない機会を提供しています。しかし、scRNA-seqデータのスパース性と高い変動性は、GRNsの推論に大きな課題をもたらしています。 現存のGRN推論手法は主に...

免疫標的—がん免疫療法のための細胞表面標的の統合的優先順位付け

癌は世界的に死亡の主要原因の一つです。近年、免疫療法が著しい進展を遂げ、例えばキメラ抗原受容体T細胞(CAR-T)療法や抗体薬物複合体(ADCs)の成功が挙げられますが、がん特異的な表面タンパク質の標的を効果的に識別することは依然として大きな課題です。表面タンパク質の標的の識別は、精密で低毒性の免疫療法の開発にとって重要です。RNAシーケンシングやプロテオミクスなどの既存の技術は、これらの標的を分析するのに役立ちますが、最適な免疫療法の標的を体系的に優先選択する方法が不足しています。 この課題に対処するため、Children’s Hospital of Philadelphia、Drexel University、BC Cancer Research Instituteなどの研究チームは、I...

単一細胞統一極性評価による免疫細胞の極性分析

免疫細胞は多様な刺激に応答してサイトカイン駆動の極化を経て、その転写プロファイルや機能状態が変化します。この動的なプロセスは、健康や疾患における免疫応答の中心的な役割を果たしています。しかし、単一細胞RNAシーケンシング(scRNA-seq)データにおけるサイトカイン駆動極化を評価するための体系的なアプローチはこれまで欠けていました。この問題を解決するために、研究者たちは単一細胞統一極化評価(SCUPA)を開発しました。これは、免疫細胞極化を包括的に評価する初めての計算手法です。 論文の出典 この論文は、Wendao LiuとZhongming Zhaoによって共同執筆されました。彼らはそれぞれThe University of Texas MD Anderson Cancer Center...

単細胞RNAシーケンスデータの空間再構築のための対照的マッピング学習

単細胞RNAシーケンス(scRNA-seq)技術は、単細胞解像度で高スループットなトランスクリプトーム解析を可能にし、細胞生物学の研究を大きく進展させました。しかし、scRNA-seq技術の重要な制約は、組織を解離する必要があるため、細胞の組織内における元の空間位置情報が失われることです。空間トランスクリプトミクス(Spatial Transcriptomics, ST)技術は、正確な空間遺伝子発現マップを提供できますが、遺伝子検出数、コスト、細胞タイプ注釈の細かさにおいて制限があります。そのため、scRNA-seqデータに空間情報を復元する方法は、現在の研究における重要な課題となっています。 この問題を解決するため、研究者たちは、scRNA-seqとSTデータの間で知識を転送する「細胞対応...