早期非小细胞肺癌总体生存的两阶段表观基因组四向基因-吸烟交互作用研究

早期非小细胞肺癌生存率与基因-吸烟四重交互作用的研究

研究背景

肺癌是全球范围内最常见的恶性肿瘤之一,也是癌症相关死亡的主要原因之一。根据全球癌症统计数据,每年约有250万新病例被诊断,180万人死于肺癌。其中,非小细胞肺癌(NSCLC)占大多数,主要包括肺腺癌(LUAD)和肺鳞状细胞癌(LUSC)。尽管近年来肺癌的治疗手段有所进步,但早期NSCLC患者的生存率仍然较低,3年生存率为13-40%,5年生存率约为25%。这种临床结果的异质性表明,肺癌的发展背后仍存在许多未被揭示的机制。

表观遗传学改变,特别是DNA甲基化,被认为是调节肿瘤发生和癌症进展的关键因素。DNA甲基化是一种可逆的表观遗传修饰过程,主要涉及DNA的5-甲基胞嘧啶(5mC)修饰。这种修饰不仅在肿瘤的早期检测中具有潜力,还为肿瘤转移和预后提供了重要见解,并指导了NSCLC患者的免疫治疗和化疗策略。此外,基因-基因(G×G)和基因-环境(G×E)交互作用在阐明复杂疾病的分子机制中起着至关重要的作用。吸烟作为环境暴露因素,已被证明会影响DNA甲基化模式,进而影响癌症的进展。

此前的研究已经发现了吸烟与DNA甲基化之间的二重和三重交互作用,但这些低阶交互作用在解释癌症进展的复杂模式方面存在局限性。因此,研究更高阶的交互作用对于揭示肺癌进展的分子机制具有重要意义。

研究来源

这项研究由来自多个国际研究机构的科学家团队合作完成,主要作者包括Leyi Chen、Xiang Wang、Ning Xie等,他们分别来自南京医科大学公共卫生学院、哈佛大学公共卫生学院、奥斯陆大学医院、隆德大学等机构。研究于2024年发表在《Molecular Oncology》期刊上,题为“A two-phase epigenome-wide four-way gene–smoking interaction study of overall survival for early-stage non-small cell lung cancer”。

研究流程与结果

研究设计

研究采用了两阶段设计,旨在探索四重基因-吸烟交互作用与早期NSCLC患者总体生存率的关系。研究的第一阶段为发现阶段,使用了来自美国哈佛大学、西班牙、挪威和瑞典的四个国际研究中心的DNA甲基化数据。第二阶段为验证阶段,使用了来自癌症基因组图谱(TCGA)数据库的数据。

研究对象与数据

研究纳入了来自五个国际研究中心的早期(I期和II期)NSCLC患者的DNA甲基化数据。发现阶段包括524名患者(425名肺腺癌患者和99名肺鳞状细胞癌患者),验证阶段包括468名患者(227名肺腺癌患者和241名肺鳞状细胞癌患者)。所有研究均获得了各机构的伦理委员会批准,并获得了患者的书面知情同意。

数据分析方法

研究采用了基于Cox比例风险模型的统计分析方法,调整了年龄、性别、吸烟状态、临床分期和研究中心等因素。通过爬山算法(hill-climbing algorithm)从低阶交互作用逐步探索高阶交互作用。多重检验校正采用错误发现率(FDR)方法,控制整体假阳性率在5%以内。

主要发现

在发现阶段,研究识别出了39对显著的四重交互作用(FDR-q ≤ 0.05),其中仅有一对在验证阶段仍然显著(p ≤ 0.05)。这一显著的四重交互作用涉及吸烟年包数(pack-year of smoking)、cg05293407TRIM27、cg00060500KIAA0226和cg16658473SHISA9。具体而言,cg16658473SHISA9与吸烟年包数、cg05293407TRIM27和cg00060500KIAA0226的交互作用显著影响了NSCLC患者的总体生存率(发现集:HRinteraction=0.9993,95% CI:0.9990–0.9996,p=3.08×10−6,FDR-q=0.027;验证集:HRinteraction=0.9992,95% CI:0.9986–0.9998,p=0.014;合并数据:HRinteraction=0.9995,95% CI:0.9993–0.9997,p=3.06×10−6)。

结果解释

通过三维图可视化,研究展示了cg16658473SHISA9在不同吸烟强度和cg05293407TRIM27甲基化水平下的差异效应。在cg00060500KIAA0226低表达亚组中,随着吸烟强度的增加和cg05293407TRIM27甲基化水平的降低,cg16658473SHISA9的风险增加;而在cg00060500KIAA0226高表达亚组中,效应完全相反。

预后预测模型

研究还构建了一个包含临床变量和四重交互作用的预后预测模型。通过时间依赖性ROC曲线和AUC值评估模型的预测能力,发现加入四重交互作用后,模型的AUC值显著提高(3年生存率AUC=0.709,5年生存率AUC=0.735),表明四重交互作用显著增强了模型的预测准确性。

研究结论与意义

研究首次在表观基因组水平上识别了一个显著的四重基因-吸烟交互作用,涉及cg16658473SHISA9、cg05293407TRIM27、cg00060500KIAA0226和吸烟年包数。这一发现为NSCLC的预后提供了新的表观遗传生物标志物,并揭示了肺癌进展的复杂分子机制。此外,研究开发的预后预测模型在临床决策中具有潜在的应用价值。

研究亮点

  1. 高阶交互作用的发现:研究首次在表观基因组水平上识别了四重基因-吸烟交互作用,为理解肺癌的分子机制提供了新的视角。
  2. 预后预测模型的改进:通过纳入四重交互作用,显著提高了预后预测模型的准确性,为临床决策提供了有力支持。
  3. 多中心数据的整合:研究整合了来自多个国际研究中心的数据,增强了结果的可靠性和普适性。

其他有价值的信息

研究还通过功能注释和基因富集分析,发现与cg16658473SHISA9相关的基因显著富集于免疫相关通路,如NF-κB、T细胞和B细胞信号通路,进一步揭示了免疫调节在肺癌进展中的重要作用。


通过这项研究,科学家们不仅揭示了NSCLC患者生存率的新机制,还为未来的肺癌治疗和预后评估提供了重要的理论依据和实践指导。