多模态深度学习在儿童低级别胶质瘤术后复发风险预测中的应用

深度学习在儿童低级别胶质瘤术后复发预测中的应用

背景介绍

儿童低级别胶质瘤(Pediatric Low-Grade Gliomas, PLGGs)是儿童中最常见的脑肿瘤类型之一,占所有儿童中枢神经系统肿瘤的30%-50%。尽管PLGGs的预后相对较好,但其术后复发风险难以通过传统的临床、影像学和基因组因素准确预测。术后复发的异质性使得术后管理决策变得复杂,尤其是关于辅助治疗和影像监测的决策。因此,开发一种能够准确预测术后复发风险的工具对于优化患者管理和改善预后具有重要意义。

近年来,深度学习(Deep Learning, DL)在医学影像分析中的应用取得了显著进展,尤其是在肿瘤分割和预后预测方面。然而,由于PLGGs的罕见性和数据稀缺性,深度学习在该领域的应用仍面临挑战。本研究旨在通过结合术前磁共振成像(MRI)和临床数据,开发一种多模态深度学习模型,以提高PLGGs术后复发风险的预测能力。

论文来源

本论文由来自多个机构的团队合作完成,主要作者包括Maryamalsadat Mahootiha、Divyanshu Tak、Zezhong Ye等,通讯作者为Benjamin H. Kann,来自哈佛医学院Dana-Farber癌症研究所和Brigham and Women’s医院。论文于2024年8月30日提前发表在《Neuro-Oncology》期刊上,DOI为10.1093/neuonc/noae173。

研究流程与结果

1. 数据集与预处理

本研究使用了来自两个机构的数据集:Dana-Farber/Boston儿童医院(DF/BCH)和儿童脑肿瘤网络(CBTN)。研究共纳入了396名患者,其中200名来自DF/BCH,196名来自CBTN。所有患者均接受了手术,并具有术前T2加权MRI影像。研究排除了患有神经纤维瘤病的患者,因其疾病轨迹与其他PLGGs不同。

MRI影像首先从DICOM格式转换为NIfTI格式,并进行N4偏置场校正以消除低频强度不均匀性。所有扫描图像被重采样为1×1×3 mm³的体素大小,并使用刚性配准进行对齐。随后,使用HD-BET软件包进行脑组织提取。

2. 深度学习特征提取

研究使用了一个预训练的3D肿瘤分割模型(基于UNet架构)来提取PLGGs的影像特征。该模型此前已在CBTN患者数据上进行了微调,但未在DF/BCH患者数据上进行训练。通过迁移学习(Transfer Learning),研究者从分割模型的编码器中提取了4096个高维特征,这些特征被认为能够捕捉肿瘤的抽象表示。

3. 事件无进展生存期(EFS)预测

研究者开发了一个全自动的深度学习管道,结合了分割模型、特征提取器和三层全连接神经网络,用于预测术后EFS。研究训练了三个模型:1)仅使用临床特征(如年龄和切除状态)的模型;2)仅使用DL-MRI特征的模型;3)结合临床和DL-MRI特征的多模态模型。

4. 模型训练与验证

研究将两个机构的数据集合并,并按EFS状态和数据来源进行分层随机分割,70%用于模型开发,30%用于测试。通过3折交叉验证评估模型的平均性能。研究还探讨了在不同机构数据上进行微调对模型性能的影响。

5. 模型性能评估

在测试集上,多模态模型的C指数(C-index)为0.85(95% CI: 0.81-0.93),显著高于仅使用DL-MRI特征(C-index: 0.79)和仅使用临床特征(C-index: 0.72)的模型。多模态模型在3年EFS预测中的AUC为0.88,同样优于其他两个模型。

6. 风险分层

多模态模型能够将患者分为低风险和高风险组,低风险组的3年EFS为92%,而高风险组仅为31%(p < 0.0001)。相比之下,仅使用DL-MRI特征和仅使用临床特征的模型在风险分层上的表现较差。

结论与意义

本研究首次展示了多模态深度学习在PLGGs术后复发预测中的应用。通过结合术前MRI影像和临床数据,深度学习模型能够显著提高术后复发风险的预测准确性,并为术后管理决策提供有力支持。研究还展示了迁移学习在小数据集上的有效性,为未来在罕见病中的应用提供了新思路。

研究亮点

  1. 多模态深度学习:首次将MRI影像特征与临床数据结合,显著提高了PLGGs术后复发风险的预测能力。
  2. 迁移学习的应用:通过预训练的分割模型提取影像特征,克服了数据稀缺性问题。
  3. 自动化管道:开发了全自动的深度学习管道,能够快速生成个性化的EFS预测曲线,具有较高的临床应用潜力。

未来展望

尽管本研究取得了显著成果,但仍需在更大规模、多中心的数据集上进行外部验证,以进一步提高模型的泛化能力。此外,未来的研究可以进一步探讨辅助治疗对模型性能的影响,并探索如何将模型整合到临床工作流程中,以优化患者管理。