非经典蛋白质组的全面发现与功能表征

学术背景 人类基因组计划(Human Genome Project)的完成极大地推动了我们对复杂生物过程的全基因组理解。然而,基因组中仅有约1%的区域编码蛋白质,其余大部分为非编码区域,产生大量的非编码RNA(ncRNA),如长链非编码RNA(lncRNA)。近年来,越来越多的研究表明,这些非编码RNA可能编码新型肽段,并在细胞活动中发挥重要作用。例如,某些lncRNA编码的肽段在肌肉生理功能、代谢调节、免疫反应等过程中扮演关键角色。然而,由于技术限制,这些非经典翻译产物(如新型肽段)的系统识别和功能表征仍然是一个巨大的挑战。 胃癌作为全球第五大常见癌症,具有高度异质性和缺乏早期诊断标志物的特点。尽管基因组学、转录组学和蛋白质组学研究已经揭示了胃癌的多组学特征,但针对新型肽段的研究仍然较少。...

MMNC——一种多模态可解释的非编码RNA分类方法

非编码RNA(ncRNA)在细胞过程和疾病发展中扮演着关键角色。尽管基因组测序项目揭示了大量非编码基因的存在,但ncRNA的功能和分类仍然是一个复杂且具有挑战性的问题。ncRNA的多样性、复杂性和功能性使其成为生物医学研究的重要对象,尤其是在生物标志物和治疗靶点的发现中。然而,现有的ncRNA分类工具大多仅依赖于单一或两种数据类型(如序列或二级结构),忽略了其他可能提供重要信息的数据源。此外,现有方法通常缺乏可解释性,难以揭示不同ncRNA类别的特征。 为了解决这些问题,来自Université Paris-Saclay和Institut Curie的研究团队提出了一种名为MMNC(Multi-Modal Interpretable Representation for Non-Coding...