mRNAの非翻訳領域とその機能予測をデコーディングするための5'UTR言語モデル

mRNAの非翻訳領域とその機能予測をデコーディングするための5'UTR言語モデル

5’非翻訳領域(5’UTR)はメッセンジャーRNA(mRNA)分子の開始端にある調節領域であり、翻訳プロセスの調節およびタンパク質発現レベルに影響を与える重要な役割を果たします。言語モデルはタンパク質と遺伝子配列の機能を解読する有効性を示してきました。この研究では、著者らは5’UTRに特化した言語モデル、UTR-LMを紹介しています。 研究背景 実際、5’UTRはmRNAの翻訳過程の調節において重要な役割を果たし、mRNAの安定性、局在、翻訳効率に影響を与えます。これまでに多くの研究が、5’UTRの生物学的特性、二次構造、相互作用するRNAタンパク質、5’UTR変異体の遺伝子発現への影響などを探求してきました。mRNAの複雑な機能とそれが人間の健康に与える潜在的な影響から、より一般的に適用可...

ロジスティック関数の双曲線正接表現:CTくも膜下出血検出のための確率的マルチインスタンス学習への適用

人工知能分野には長年にわたって「弱教師あり学習」の問題がありました。つまり、訓練データにおいて、一部分のラベルのみが観測可能で、残りのラベルは未知です。多インスタンス学習(Multiple Instance Learning、略してMIL)は、この問題を解決する1つのパラダイムです。MILでは、訓練データがいくつかの「バッグ」(bag)に分けられており、各バッグには複数のインスタンス(instance)が含まれています。私たちはバッグのラベルのみを観測できますが、個々のインスタンスのラベルを知ることはできません。MILの目標は、バッグのラベルに基づいて、新しいバッグとそれに含まれるインスタンスのラベルを予測することです。 MILパラダイムは様々な科学分野で広く応用されており、特に医療画像分野...