非经典蛋白质组的全面发现与功能表征
学术背景
人类基因组计划(Human Genome Project)的完成极大地推动了我们对复杂生物过程的全基因组理解。然而,基因组中仅有约1%的区域编码蛋白质,其余大部分为非编码区域,产生大量的非编码RNA(ncRNA),如长链非编码RNA(lncRNA)。近年来,越来越多的研究表明,这些非编码RNA可能编码新型肽段,并在细胞活动中发挥重要作用。例如,某些lncRNA编码的肽段在肌肉生理功能、代谢调节、免疫反应等过程中扮演关键角色。然而,由于技术限制,这些非经典翻译产物(如新型肽段)的系统识别和功能表征仍然是一个巨大的挑战。
胃癌作为全球第五大常见癌症,具有高度异质性和缺乏早期诊断标志物的特点。尽管基因组学、转录组学和蛋白质组学研究已经揭示了胃癌的多组学特征,但针对新型肽段的研究仍然较少。因此,系统性地发现和功能表征这些非经典肽段,不仅有助于深入理解基因组的功能,还可能为癌症的诊断和治疗提供新的思路。
论文来源
这篇论文由Chengyu Shi、Fangzhou Liu、Xinwan Su等来自浙江大学、浙江大学医学院附属第四医院、浙江大学癌症中心等多个机构的科研团队共同完成。论文于2025年发表在Cell Research期刊上,题为《Comprehensive discovery and functional characterization of the noncanonical proteome》。
研究流程
1. 新型肽段的识别
研究团队首先构建了一个高覆盖度的肽段测序参考库,包含了11,668,944个开放阅读框(ORF)。为了识别新型肽段,他们采用了超滤串联质谱(ultrafiltration tandem mass spectrometry, MS)技术。通过对正常胃组织、胃癌组织及细胞系的分析,研究团队成功鉴定了8945个此前未被注释的肽段,其中近一半来自非编码RNA。
2. CRISPR筛选与功能验证
为了进一步研究这些肽段的功能,研究团队进行了CRISPR筛选,发现1161个肽段与肿瘤细胞增殖相关。基于筛选得分、氨基酸长度等多个指标,研究团队选择了部分肽段进行功能验证。通过FLAG-Knockin等多种方法,验证了这些肽段的存在及其生理功能。
3. 人工智能结构与肽-蛋白质相互作用网络分析
为了进一步揭示这些肽段的潜在调控机制,研究团队构建了一个基于人工智能(AI)结构预测和肽-蛋白质相互作用网络的框架。通过对前100个候选肽段的分析,揭示了这些癌症相关肽段的多样化亚细胞定位及其在特定细胞器过程中的参与。
4. 肽段的功能验证与临床相关性
研究团队进一步验证了四个代表性肽段(PEP1-NC-OLMALINC、PEP5-NC-TRHDE-AS1、PEP-NC-ZNF436-AS1和PEP2-NC-AC027045.3)的功能,发现它们在线粒体复合物组装、能量代谢和胆固醇代谢中发挥重要作用。此外,这些肽段的失调与临床预后密切相关。
主要结果
新型肽段的识别:通过超滤串联质谱技术,研究团队成功鉴定了8945个此前未被注释的肽段,其中4097个肽段由单个肽段-质谱匹配(PSM)支持,4866个肽段由至少两个不同的PSM支持。这些肽段主要来源于非编码RNA,显示出非编码RNA在编码功能肽段方面的潜力。
CRISPR筛选与功能验证:通过CRISPR筛选,研究团队发现1161个肽段与肿瘤细胞增殖相关。进一步的功能验证表明,这些肽段在肿瘤细胞增殖中发挥重要作用,且其功能依赖于肽段本身的翻译,而非其宿主lncRNA的转录。
人工智能结构与肽-蛋白质相互作用网络分析:基于AlphaFold2的结构预测和肽-蛋白质相互作用网络分析,研究团队揭示了这些肽段的多样化亚细胞定位及其在细胞代谢、能量代谢等过程中的参与。特别是,这些肽段可能通过与线粒体、溶酶体等细胞器中的蛋白质相互作用,调控细胞代谢过程。
肽段的功能验证与临床相关性:在体内外实验中,研究团队验证了四个代表性肽段的功能,发现它们在肿瘤生长和代谢调控中发挥重要作用。临床样本分析表明,这些肽段的表达水平与胃癌患者的预后密切相关,提示它们可能作为潜在的癌症生物标志物。
结论与意义
这项研究首次系统性地发现并功能表征了人类基因组中的非经典肽段,揭示了非编码RNA在编码功能肽段方面的潜力。通过结合高通量质谱技术、CRISPR筛选和人工智能结构预测,研究团队成功鉴定了大量新型肽段,并揭示了它们在肿瘤细胞增殖和代谢调控中的重要作用。这些发现不仅为理解基因组的功能提供了新的视角,还为癌症的诊断和治疗提供了潜在的生物标志物和药物靶点。
研究亮点
高通量肽段识别:研究团队通过超滤串联质谱技术,成功鉴定了8945个新型肽段,这是迄今为止在蛋白质组水平上识别到的最多新型肽段。
CRISPR筛选与功能验证:通过CRISPR筛选,研究团队发现了1161个与肿瘤细胞增殖相关的肽段,并通过多种实验验证了它们的功能。
人工智能结构预测:研究团队首次将AlphaFold2结构预测与肽-蛋白质相互作用网络分析相结合,揭示了这些肽段的多样化功能机制。
临床相关性:研究团队验证了四个代表性肽段在肿瘤生长和代谢调控中的功能,并发现它们的表达水平与胃癌患者的预后密切相关,提示它们可能作为潜在的癌症生物标志物。
其他有价值的信息
研究团队还建立了一个名为“Human Novel Peptides Atlas Database”的数据库(http://hmpa.zju.edu.cn/),用于整合和分享新型肽段的研究数据,为后续研究提供了宝贵的资源。