分享自:

一种基于基因组不稳定性长链非编码RNA风险签名的子宫内膜癌预后预测研究

期刊:journal of cancerDOI:10.7150/jca.65581

关于《Journal of Cancer》2022年文章的学术报告

一、研究主要作者及其机构信息

本文的研究题目为“Development of a genomic instability-derived lncRNAs-based risk signature as a predictor of prognosis for endometrial cancer”,由 Xiaojun Wang, Lei Ye 和 Bilan Li 主导完成,第一作者 Xiaojun Wang 和 Lei Ye 为共同第一作者,通讯作者为 Bilan Li。研究团队隶属于中国上海的“上海市第一妇婴保健院”和“同济大学医学院妇产科”。本文发表于 《Journal of Cancer》 2022年第13卷第7期,页码为2213-2225,DOI 为10.7150/jca.65581,在线出版日期为2022年4月11日。


二、研究的学术背景

研究领域及必要性: 子宫内膜癌(endometrial cancer,简称EC)是发达国家中第四高发的妇科恶性肿瘤,全球每年诊断病例约28万例。这种癌症通常发生在55至65岁的绝经后女性中。尽管部分患者由于出现异常阴道出血得以早期诊断,5年生存率较高,但仍有约20%的患者在诊断时已出现骨盆或淋巴结转移,10%的患者有远处转移。晚期患者的5年生存率急剧下降,I期患者为80%-90%,而IV期仅为约20%。因此,评估EC患者预后并制定新的预测模型至关重要。

基因组不稳定性(genomic instability)的意义: 基因组不稳定性和突变是许多恶性肿瘤的标志,尤其是DNA修复机制的异常常被认为是关键的预后因素。然而,绝大多数这些突变发生在非编码区域,其中产生的转录产物多为长非编码RNA(long non-coding RNA,lncRNA)。研究表明,lncRNA在肿瘤中具有调节基因稳定性的重要作用,某些lncRNA的异常上调可能促进肿瘤的发生发展,而另一些lncRNA则有助于DNA修复。然而,lncRNA与子宫内膜癌患者基因组不稳定性的临床意义尚未得到系统研究。

研究目的: 本研究旨在通过基因组不稳定性相关lncRNA的表达数据,建立基于lncRNA的风险评分模型(命名为GILncSig),用于预测子宫内膜癌患者的预后,并验证其作为独立预后预测因子的可行性与临床应用潜力。


三、研究方法和流程

研究设计包括从TCGA数据库提取数据、筛选基因组不稳定性相关lncRNA、构建风险评分模型(GILncSig)、以及功能验证与预测分析,研究流程具体分为以下多个步骤:

  1. 数据提取与预处理:

    • 从TCGA(The Cancer Genome Atlas)数据库获取子宫内膜癌患者的转录组数据、临床数据及体细胞突变数据。
    • 提取499份EC样本中3527个lncRNA的表达数据,同时筛去表达不足的基因(表达率低于30%)。最终整合数据,并得到了配对的突变和表达数据。
  2. 与基因组不稳定性相关的lncRNA筛选:

    • 根据突变频率,将患者分为前25%(基因组不稳定性组,GU-like)和后25%(基因组稳定性组,GS-like)。
    • 使用R软件的Limma包对两组患者的lncRNA表达差异进行分析,筛选出了78个基因组不稳定性相关的差异lncRNA(32个上调,46个下调)。
  3. 聚类分析与生物功能注解:

    • 实施层次聚类分析(hierarchical clustering),验证这78个lncRNA是否能有效区分基因组稳定与不稳定组。
    • 构建lncRNA-mRNA共表达网络,利用功能富集分析(Gene Ontology和KEGG)研究这些lncRNA关联基因的潜在生物学功能,发现与细胞周期调控、DNA修复等密切相关。
  4. 风险评分模型(GILncSig)的建立:

    • 将样本随机分为训练组和测试组(比例为7:3)。
    • 在训练集上进行单因素Cox回归分析,筛选与患者生存显著相关的22个lncRNA;进一步应用LASSO回归法收缩变量,最终选定15个lncRNA计算风险评分。
    • 风险评分公式:风险评分= Σ(lncRNA表达量×回归系数)。
  5. 模型验证及临床预测功能分析:

    • 按照中位风险评分,将患者分为高风险组和低风险组,分析不同组的生存率曲线。
    • 在训练组、测试组和全TCGA数据集上分别绘制ROC曲线验证模型预测准确性。
  6. 临床分层与独立预后价值分析:

    • 评估风险评分与患者的临床特征(如分期、年龄、BMI等)的相关性。
    • 进行单变量及多变量Cox回归分析,验证GILncSig对患者总体生存(OS)的独立预测能力。
  7. 列线图(Nomogram)构建:

    • 基于GILncSig与关键临床因子整合的回归模型,建立直观的列线图(Nomogram)用于临床实际的个体化风险预测。

四、研究主要结果

  1. 基因组不稳定性lncRNA的筛选与功能:

    • 层次聚类验证了78个差异lncRNA可区分GU-like和GS-like群体。
    • GO和KEGG分析揭示,这些lncRNA涉及细胞周期调控和DNA修复功能。
  2. GILncSig风险模型性能:

    • 15个lncRNA的风险评分显著区分了预后高风险与低风险患者。高风险组显现不良生存结果。
    • 在训练集的1年、3年和5生存预后预测的AUC分别为0.828、0.811和0.837,模型在测试集和全数据集中的预测效果一致。
  3. 预测独立性和临床意义:

    • 多变量COX分析表明,GILncSig能够独立于传统临床因素(年龄、分期、分级)预测预后。
    • 风险评分与肿瘤分期和分级显著相关,随分期和分级恶化呈现风险评分升高。
  4. 列线图预测工具:

    • GILncSig结合其他因素的列线图精确预测1至5年生存率,校准曲线验证了模型预测的可靠性。

五、研究结论及意义

本研究通过基因组不稳定性相关lncRNA的筛选与验证,构建了具有良好独立预测价值的GILncSig风险评分模型。该模型能够显著区分子宫内膜癌患者的高低风险,并与基因组突变模式强相关,为个体化预后判断和指导治疗提供了重要工具。同时,结合列线图模型,本研究显著提升了预后预测的精度和应用价值。


六、研究亮点与展望

  1. GILncSig首次系统性整合了基因组不稳定性与lncRNA在子宫内膜癌中的预后相关性,并纳入了多组学数据验证。
  2. 研究显示,风险评分模型与实际临床分组高度相关,提示了潜在的应用空间。
  3. 尽管部分lncRNA功能仍需进一步实验验证,该模型在临床应用转化上的潜力广泛,值得进一步研究与临床试验探索。

本研究为基因组不稳定性的肿瘤学研究提供了新视角,同时为子宫内膜癌的预后预测与分子分型开辟了新途径。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com