分享自:

表皮间质转化相关基因表达谱作为子宫内膜癌的预后生物标志物

期刊:journal of cancerDOI:10.7150/jca.62729

研究报告:基于上皮-间质转化相关基因的表达用于子宫内膜癌的预后模型构建与验证


一、研究背景与发表信息

这项研究由Lei Ye、Xiaojun Wang 和 Bilan Li等作者完成,他们隶属于上海交通大学附属第一妇婴保健医院和同济大学医学院妇科部门。研究发表在 Journal of Cancer (2021, Vol. 12) 上,具体文章题为“Expression Profile of Epithelial-Mesenchymal Transition-Related Genes as a Prognostic Biomarker for Endometrial Cancer”。该研究于2021年5月投稿,同年8月被接收,并于2021年9月正式发表,DOI编号为10.7150/jca.62729。


二、研究背景与意义

子宫内膜癌(Endometrial Cancer, EC)是全球女性发病率排在前六位的恶性癌症之一。2018年的数据显示,新诊断的子宫内膜癌病例多达382,096例,死亡率高达89,929人。子宫内膜癌早期诊治效果较好,通常可以通过手术、放疗、激素治疗及辅助化疗实现较高的治愈率。然而,对于晚期或复发性子宫内膜癌,其生存预期较差,中位生存时间仅为12个月。

传统基于雌激素受体双分子模型进行子宫内膜癌分型的理论对于指导患者预后和治疗选择的价值有限。这主要是因为该疾病在临床表现和生物学特征上存在高度异质性。另外,现有分子分型系统虽然能够对特定分子途径进行分类(如POLE超突变型、MSI高突变型等),但并不完全涵盖所有子宫内膜癌的分子特征。此外,上皮-间质转化(Epithelial-Mesenchymal Transition, EMT)在肿瘤侵袭和进展中起重要作用,这使得相关基因成为重要的研究对象。

本研究旨在通过系统分析子宫内膜癌中EMT相关基因的表达模式,探索其对预后的预测能力,并基于此构建区分高风险和低风险患者的预后模型。这一模型的实用性为精准治疗提供了新的参考。


三、研究流程与实验设计

1. 数据收集

研究使用了两个主要数据集: - TCGA(The Cancer Genome Atlas) 数据集:包括543例子宫内膜癌原发样本的mRNA表达谱和临床信息。 - GEO(Gene Expression Omnibus) 数据集中的GSE102073数据集:包含85例子宫内膜癌样本,用作模型验证样本。

此外,从dbEMT数据库下载了1184个EMT相关基因。

2. 数据预处理与一致性聚类分析
  • 研究对来自543例子宫内膜癌样本中的1169个能够检测到的EMT基因进行一致性聚类分析,最终将样本分为两组(E1组380例,E2组163例)。
  • 通过Kaplan-Meier分析发现,E1组患者的总生存期(Overall Survival, OS)显著优于E2组。
3. 差异基因筛选与通路富集分析
  • 使用R包“limma”筛选两组之间的差异表达基因,共鉴定到370个差异基因(上调237个,下调133个)。
  • 进一步筛选出44个与EMT相关的差异基因,并利用GO和KEGG富集分析确定它们在细胞基质黏附、磷酸化负调节等多个生物学过程中具有重要作用。
4. 生存分析与预后模型构建
  • 单变量Cox回归分析筛选出25个与预后显著相关的基因。
  • 使用LASSO方法进一步筛选,最终确定了5个关键的预后相关基因:L1CAM、PRKCI、ESR1、CDKN2A和VIM。
  • 基于基因表达水平和回归系数,构建风险评分公式:
    风险评分 = 0.0811 × L1CAM + 0.01497 × PRKCI - 0.0512 × ESR1 + 0.0684 × CDKN2A - 0.0131 × VIM
5. 模型验证与数据分析
  • 在TCGA数据集中,通过风险评分对患者分组(高风险组和低风险组),并发现低风险组的预后显著优于高风险组。
  • ROC曲线分析显示,该模型对于预测患者生存的AUC为0.668。
  • 使用GEO数据集(GSE102073)进行外部验证,模型同样显示出较好的预测准确性,AUC为0.631。
6. 临床验证
  • 通过免疫组化(IHC)验证两种关键基因(VIM和ERα)的表达模式。结果显示,在分化程度更高的肿瘤样本中,这两种基因的表达水平均显著上调,并与早期肿瘤(I/II期)显著相关。

四、主要研究结果

  1. 一致性聚类结果: 基于EMT相关基因的表达模式,TCGA数据集中样本被分成两组,预后明显不同。E1组生存率较高,而E2组与较差的预后相关。

  2. 差异基因与富集分析: 筛选出的44个与EMT相关的差异基因通过通路分析发现,主要参与了肿瘤的细胞黏附、信号通路调节、以及对EB病毒感染的反应等过程。

  3. 关键基因与模型构建: 通过Cox回归和LASSO分析,筛选出L1CAM等5个关键基因并生成风险打分公式。高风险组的患者生存期显著低于低风险组。

  4. 模型预测性能验证: 在TCGA和GEO数据中,风险评分模型都表现出良好的预后预测能力,AUC分别为0.668和0.631。

  5. 免疫组化验证: Vimentin和ERα呈现分期和分化相关的特定表达模式,具有一定的临床预后价值。


五、研究结论及意义

本研究创新性地基于EMT相关基因的表达,从TCGA和GEO数据集中构建并验证了一个有效的子宫内膜癌预后模型。该模型能够将患者分为高风险和低风险组,并对其预后进行准确预测。研究还探讨了VIM和ERα作为潜在生物标志物的临床应用价值,进一步加深了对子宫内膜癌EMT机制的理解。这一模型在精准医学和个性化治疗中具有重要潜力。


六、研究亮点及创新点

  • 集成大规模数据集,系统性分析EMT相关基因在子宫内膜癌中的表达特点。
  • 提出了基于五个关键基因的新型预后模型,具有较高的预测能力。
  • 将生物信息学、实验验证和临床应用相结合,开拓了新的研究视角。

七、研究局限与展望

尽管研究取得了重大进展,但也存在一些局限性: 1. 仅利用TCGA作为主要数据来源,需更多独立队列验证模型可靠性。 2. 对基因如何参与EMT的机制性研究尚需深入探讨。 3. 临床应用需要进一步的长期随访和试验验证。

未来的工作应集中在阐明关键基因在子宫内膜癌进展中的分子机制,并探索基于EMT相关标志物的精准治疗策略。


以上内容全面总结了该研究的实验设计、研究结果及科学意义,展现了研究论文的重要价值和创新性。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com