本文介绍了一项关于胶质瘤(glioma)诊断的原创研究,该研究由Rui Jiang、Xiaoxu Yin、Pengshuai Yang等来自清华大学、中南大学等机构的研究团队完成,并于2024年8月发表在《Nature Machine Intelligence》期刊上。研究提出了一种基于Transformer的弱监督计算方法ROAM(Region of Interest Attention Model),旨在通过计算病理学方法实现胶质瘤的临床级诊断和分子标志物发现。
胶质瘤是最常见的原发性颅内肿瘤,其5年相对生存率极低。胶质瘤的组织病理学分类复杂,通常分为星形细胞瘤(astrocytoma)、少突胶质细胞瘤(oligodendroglioma)和室管膜瘤(ependymoma),每种类型又可进一步分为多个等级。准确的分类和分级对胶质瘤的预后评估和治疗计划至关重要。然而,现有的计算病理学方法在准确性、可靠性和辅助诊断能力方面存在局限性,且缺乏对分子和形态学相关性的深入分析。因此,研究团队提出了ROAM模型,旨在通过扩大感兴趣区域(ROI)和引入金字塔Transformer来捕捉胶质瘤的关键形态学特征,从而实现自动化的临床级诊断。
ROAM模型基于多实例学习(Multiple-Instance Learning, MIL)框架,结合了大规模ROI和金字塔Transformer。其工作流程包括以下几个步骤:
ROI提取与特征提取:首先从全切片图像(Whole-Slide Image, WSI)中分割出组织区域,并从中提取大尺寸的ROI(2048×2048像素)。随后,对每个ROI进行两次下采样,生成三个不同放大倍数的图像(2048×2048、1024×1024、512×512)。每个图像被分割为256×256的小图像块,并通过预训练的卷积神经网络提取视觉特征。
多尺度特征学习:ROAM使用金字塔Transformer框架来捕捉不同放大倍数下的形态学特征。通过自注意力机制(Self-Attention, SA),模型能够学习同一放大倍数下不同图像块之间的相关性(intrascale SA)以及不同放大倍数之间的相关性(interscale SA)。最终,模型将这些多尺度特征融合,生成ROI的视觉表示。
实例特征聚合:ROAM采用基于注意力的加权聚合方法,将多个ROI的特征聚合为整个WSI的视觉表示,并生成最终的诊断预测。
多级监督:模型通过袋级(bag-level)和实例级(instance-level)监督机制进行训练,确保模型能够有效利用数据并学习实例的特征表示。
研究团队在内部数据集和外部数据集上对ROAM模型进行了全面评估。结果表明,ROAM在胶质瘤检测、亚型分类、分级以及分子特征预测等任务中均表现出色。具体来说,ROAM在三类胶质瘤检测任务中的AUC(Area Under Curve)达到了0.990±0.002,在三类胶质瘤亚型分类任务中的AUC为0.950±0.003。此外,ROAM在预测IDH突变和MGMT启动子甲基化等分子特征方面也表现出较高的准确性,AUC分别为0.918±0.007和0.762±0.003。
ROAM模型还展示了其在独立外部数据集上的良好泛化能力。在TCGA数据集上的测试中,ROAM在胶质瘤亚型分类和IDH突变预测任务中的AUC分别达到了0.875±0.005和0.886±0.008,显著优于其他基线方法。
ROAM模型通过结合大规模ROI和金字塔Transformer,成功捕捉了胶质瘤的关键形态学特征,提供了准确、可靠且适应性强的临床级诊断。此外,ROAM生成的注意力热图能够帮助病理学家识别与诊断相关的形态学特征,并探索分子与形态学之间的相关性。研究还通过人机协作,发现了一些与IDH突变相关的形态学标志物,为未来的胶质瘤诊断提供了新的见解。
尽管ROAM在胶质瘤诊断中表现出色,但仍有一些局限性需要进一步研究。例如,大规模ROI可能会影响热图的精度,且模型在处理小组织区域时表现不佳。未来的研究可以探索更灵活的图像信息提取方法,并结合其他模态数据(如放射影像和分子标志物)来进一步提高诊断的准确性。
总的来说,ROAM为计算病理学领域提供了一种新的解决方案,具有重要的科学价值和临床应用前景。