通过多任务学习改进儿科低级别胶质瘤的分割

改进通过多任务学习对儿童低级别胶质瘤的分割

背景介绍

儿童脑肿瘤分割是肿瘤容积分析和人工智能算法中的关键任务。然而,这一过程耗时且需要神经放射学专家的专业知识。虽然已有大量研究集中于优化成人脑肿瘤分割,但关于人工智能引导的儿童肿瘤分割研究却凤毛麟角。此外,儿童和成人脑肿瘤的MRI信号特征不同,需要专门为儿童脑肿瘤设计分割算法。因此,本文提出将脑肿瘤的基因变化分类器作为辅助任务添加到主要网络中,通过多任务学习(Deep Multitask Learning, DMTL) 提高分割结果的准确性。

论文来源

这项研究由以下研究人员开展:Partoo Vafaeikia, Matthias W. Wagner, Cynthia Hawkins, Uri Tabori, Birgit B. Ertl-Wagner和Farzad Khalvati。研究所属单位包括加拿大多伦多儿童医院、University of Toronto以及Vector Institute。这篇论文发表于IEEE Engineering in Medicine & Biology Society (EMBC) 2022年度国际会议。

工作流程

研究方法和实验设置

研究提出了一种基于MRI的模型,用于儿童低级别胶质瘤(Pediatric Low-Grade Gliomas, PLGGs)的分割,同时将肿瘤基因变化的分类作为辅助任务。具体流程如下:

  1. 数据准备:从2000到2018年在儿童医院接受治疗的311名儿童患者的液体衰减反转恢复序列MRI(FLAIR MRI)进行了数据收集。由两位神经放射学家共同提供了肿瘤的真实分割(ground-truth),并通过活检评估了相关的基因标记。

  2. 模型架构:基于U-Net网络对数据进行训练。为了生成分类输出,在U-Net的瓶颈层添加了一分支全连接层,实现在分割和分类任务之间的共享。该研究已经获得儿童医院研究伦理委员会的批准,且伦理委员会豁免了知情同意书的要求。

  3. 分割任务:使用基于Encoder-Decoder架构的U-Net网络,编码器部分主要提取图像特征,解码器部分则重建分割蒙版。为确保数据维度和坐标系一致,所有图像注册到基于MRI的SRI24大脑图谱,再进行分割算法执行。

  4. 分类任务:分类任务用于识别PLGG的三种主要基因变化:BRAF V600E突变、BRAF融合以及其他罕见的分子标记。将分类网络添加到U-Net编码器的瓶颈部分,通过共享编码器来提高模型的泛化能力。

  5. 损失函数和优化:利用Adam优化器和特定的损失函数(分割使用Soft Dice Loss,分类使用加权的交叉熵损失),对模型进行优化训练。

主要结果

在相同的训练、验证和测试数据集上,分别训练了单任务模型和多任务模型。结果显示:

  • 在4次测试中,多任务学习方法在分割任务中的表现分别在验证集和测试集中平均提高了3%(从0.77提升至0.80)和4%(从0.74提升至0.78)。
  • 其余2次测试中,多任务和单任务模型表现相近。
  • 总体来看,多任务学习方法在验证集和测试集中的平均分割性能分别提高了2.10%和3%。

这种性能提升主要由于通过将分类任务作为辅助任务,模型学习到了与基因特征相关的有用信息,这增强了数据的可用表征,减少了过拟合现象并改善了模型的泛化能力。

数据展示

部分实验结果如下表所示,展示了在不同数据分割环境下(每次改变训练、验证和测试数据集的划分),单任务和多任务模型的表现差异:

| 验证Dice | 测试Dice | | 单任务 | 多任务 | 单任务 | 多任务 | | – | – | – | – | | 1 | 0.76 | 0.82 | 0.70 | 0.83 | | 2 | 0.75 | 0.80 | 0.76 | 0.77 | | 3 | 0.78 | 0.78 | 0.78 | 0.80 | | 4 | 0.79 | 0.80 | 0.73 | 0.74 | | 5 | 0.76 | 0.77 | 0.80 | 0.80 | | 6 | 0.76 | 0.76 | 0.70 | 0.70 | | 平均Dice | 0.77 | 0.79 | 0.74 | 0.77 |

研究结论与意义

通过本研究,提出了一种基于深度多任务学习的方法来改进儿童低级别胶质瘤(PLGG)在MRI中的分割性能。通过加入基因标记物分类器作为辅助任务,该方法在分割任务中表现出了显著的改善。相比于传统单任务模型,多任务学习模型在验证和测试数据集中的分割性能分别提高了2.10%和3%,展示了很好地泛化能力和应用价值。

这种研究方法的创新之处不仅在于利用辅助任务提升主要任务的性能,还在于整合了先进的深度学习技术(如ResNet模块和U-Net架构),并将其应用于儿童肿瘤领域,为今后非侵入性基因标记物评估提供了新的研究方向。

研究亮点和价值

  1. 创新算法:提出的多任务学习方法通过分类基因标记物辅助分割任务,展现了更高的可用表征能力。
  2. 应用广泛:该方法不仅有助于改进儿童肿瘤分割,还为未来的非侵入性诊断研究提供了基础。
  3. 提升准确性:在实际测试环境中表现出显著提高,应用于临床诊断具有重要潜力。
  4. 数据处理:研究还解决了由于儿童和成人MRI信号特征差异带来的挑战,强调了针对特定人群数据开发模型的重要性。

通过这种综合性的研究方法和实验验证,本研究在儿童低级别胶质瘤分割领域取得了显著进展,为未来的研究和临床应用指明了方向。