解码蛋白质相分离密码:基于语言模型和构象嵌入的PSTP算法助力病理变异解释
一、学术背景与研究意义 近年来,蛋白质液-液相分离(phase separation,PS)作为调控细胞内生物分子的关键机制,受到生命科学领域的广泛关注。相分离不仅推动了无膜细胞器(biomolecular condensates)的形成,还广泛影响着生化反应速率、蛋白质组织与定位,并与癌症和神经变性疾病等重大疾病的发生密切相关。尽管相分离现象的生物学意义逐渐被认识,但其驱动机制和调控密码仍显复杂且难以捉摸,尤其是在驱动相分离的蛋白质区域识别方面,科学界仍然面临诸多挑战。 传统的相分离预测方法,大多依赖已有的蛋白质注释信息或人工设定的特征参数。这些方法虽然在已知蛋白质上表现良好,但面临着对未知蛋白质、变体和不同物种间广泛泛化能力的严重不足。同时,针对蛋白质序列的局部驱动区域(residue-...