拉曼光谱平台揭示IDH突变和野生型胶质瘤的独特代谢差异
基于拉曼光谱和机器学习平台的IDH突变与野生型胶质瘤细胞代谢差异研究
背景介绍
在胶质瘤的诊断和治疗中,福尔马林固定、石蜡包埋(FFPE)组织切片通常被广泛应用。然而,受到包埋介质背景噪声的影响,FFPE组织在基于拉曼光谱的研究中应用有限。为了克服这一问题并识别肿瘤亚型,本研究开发了一种新型的基于拉曼光谱的机器学习平台——APOLLO(恶性胶质瘤的拉曼光谱病理学),该平台能够从FFPE组织切片中预测胶质瘤亚型。
论文来源
这篇文章由Adrian Lita、Joel Sjöberg、David Păcioianu等学者撰写,作者来自美国国立癌症研究所(National Cancer Institute)、芬兰图尔库大学(University of Turku)、罗马尼亚布加勒斯特大学(University of Bucharest)、亨利福特健康系统(Henry Ford Health System)等。论文发表于2024年6月的《Neuro-Oncology》杂志。
研究流程
研究对象和样本
研究获取了46例患者的FFPE样本,这些样本的甲基化亚型已知,并且用H&E染色确认了肿瘤细胞的存在。之后,通过自发拉曼光谱对这些样本进行了分子指纹图谱采集,并利用支持向量机和随机森林算法构建了肿瘤/非肿瘤、IDH1突变/野生型和甲基化亚型分类器。
数据采集和预处理
使用ThermoFisher DXR2xi拉曼显微镜和Leica Stellaris 8 CRS显微镜,收集了每个样本的拉曼光谱数据。在数据预处理过程中,移除了沉默区域并进行了基线校正和归一化处理,以确保拉曼光谱数据的可靠性。
算法和模型训练
使用DBSCAN聚类算法识别肿瘤和非肿瘤组织,并对每个扫描区域分别训练了机器学习聚类模型。然后,通过5折交叉验证训练多个分类器,包括随机森林模型和支持向量机,以优化模型的准确性、精确度和召回率。最终,通过随机森林特征排序和统计测试,提取了区分肿瘤/非肿瘤和IDH突变/野生型所需的最重要的拉曼频率。
实验结果验证
利用SRS对拉曼光谱频率进行了验证,结果显示,APOLLO平台能够高效地区分肿瘤与非肿瘤组织,以及IDH1突变与野生型肿瘤。特别地,APOLLO平台识别出IDH1突变胶质瘤中胆固醇酯水平显著增加,这意味着IDH突变肿瘤在代谢上具有特异性。
研究结果
肿瘤与非肿瘤组织的区分
利用ANOVA、chi2和随机森林模型进行拉曼频率的重要性排序时,发现拉曼频率2850 cm^-1(丰富于脂类的CH2键)在区分肿瘤与非肿瘤组织方面具有极高的重要性。而其他新发现的拉曼频率如2883 cm^-1、1690 cm^-1、1607 cm^-1、1401 cm^-1和1335 cm^-1也在肿瘤组织中显示出高强度。
IDH1突变与野生型胶质瘤的区分
通过多种分类器模型的训练,APOLLO准确区分了IDH1突变与野生型胶质瘤,平均ROC AUC达到0.82。特别地,拉曼光谱频率2883 cm^-1、1440 cm^-1和532 cm^-1的胆固醇酯信号对于区分IDH1突变肿瘤至关重要。
更细致的亚型区分
APOLLO能够有效地区分IDH1突变的高CpG岛高甲基化表型(g-CIMP-high) 和 低甲基化表型(g-CIMP-low)胶质瘤。这一分类在临床上具有重要意义,因为g-CIMP-high亚型与较好的预后相关。
研究意义
APOLLO平台展示了无标签拉曼光谱在从FFPE切片中提取有意义的生物学信息方面的潜力,开辟了FFPE样本在其他癌症研究中的应用前景。这项研究不仅展示了基于机器学习的自动分类方法的有效性,还发现了IDH1突变胶质瘤中胆固醇代谢的特异性差异,为药物靶向提供了新的思路。
亮点介绍
- 创新性平台:APOLLO是一种新型的拉曼光谱和机器学习平台,能够从FFPE组织切片中准确预测胶质瘤亚型。
- 高胆固醇代谢的发现:发现IDH1突变的胶质瘤中胆固醇酯水平显著增加,提出了关于肿瘤生物学的新见解。
- 全流程自动化:APOLLO平台实现了全自动化数据处理和分类,无需人为干预,大大提高了分析效率。
本研究为胶质瘤的分子分类和治疗提供了重要的科学依据和临床应用价值。未来,APOLLO平台还可以延伸至其他类型的FFPE组织和癌症研究中,推动肿瘤学和分子病理学的发展。