蛋白质结构预测:挑战、进展与研究范式的转变

蛋白质结构预测:挑战、进展及研究范式的变化 蛋白质结构预测是一个吸引了生物化学、医学、物理学、数学和计算机科学等多个领域研究者的重要跨学科研究课题。研究者们采取了多种研究范式去解决同一个结构预测问题:生物化学家和物理学家试图揭示蛋白质折叠的原理;数学家,尤其是统计学家,通常从假设给定目标序列的蛋白质结构概率分布开始,然后找到最可能的结构;而计算机科学家将蛋白质结构预测视为一个优化问题——寻找具有最低能量的结构构象或最小化预测结构与天然结构之间的差异。最近,深度学习在蛋白质结构预测中也取得了巨大成功。在这篇综述中,本文呈现了一项对蛋白质结构预测努力的调查。我们比较了不同领域研究者采用的研究范式,重点是深度学习时代研究范式的转变。 作者简介及论文出处 本文由Bin Huang, Lupeng K...

5'非翻译区语言模型用于解码mRNA的非翻译区域和功能预测

5'非翻译区语言模型用于解码mRNA的非翻译区域和功能预测

5’非翻译区(5’UTR)是信使RNA(mRNA)分子起始端的一个调控区域,在调节翻译过程及影响蛋白质表达水平方面发挥着关键作用。语言模型已展现出解码蛋白质和基因组序列功能的有效性。在这项研究中,作者们介绍了一种针对5’UTR的语言模型,简称为UTR-LM。 研究背景 事实上,5’UTR在调控mRNA的翻译过程中扮演着重要角色,可以影响mRNA的稳定性、定位和翻译效率。之前已有大量研究探索了5’UTR的生物学特征,包括它的二级结构、可能与之互作的RNA结合蛋白,以及5’UTR突变对基因表达的影响等。mRNA的复杂功能及其对人类健康的潜在影响,凸显了需要开发更具普遍适用性的计算方法。 研究来源 本研究由普林斯顿大学电子与计算机工程系的Mengdi Wang教授课题组、斯坦福大学病理系的Le C...