5'非翻译区语言模型用于解码mRNA的非翻译区域和功能预测
5’非翻译区(5’UTR)是信使RNA(mRNA)分子起始端的一个调控区域,在调节翻译过程及影响蛋白质表达水平方面发挥着关键作用。语言模型已展现出解码蛋白质和基因组序列功能的有效性。在这项研究中,作者们介绍了一种针对5’UTR的语言模型,简称为UTR-LM。 研究背景 事实上,5’UTR在调控mRNA的翻译过程中扮演着重要角色,可以影响mRNA的稳定性、定位和翻译效率。之前已有大量研究探索了5’UTR的生物学特征,包括它的二级结构、可能与之互作的RNA结合蛋白,以及5’UTR突变对基因表达的影响等。mRNA的复杂功能及其对人类健康的潜在影响,凸显了需要开发更具普遍适用性的计算方法。 研究来源 本研究由普林斯顿大学电子与计算机工程系的Mengdi Wang教授课题组、斯坦福大学病理系的Le C...