合成辅助预训练和补丁级特征对齐的多类别宫颈病变细胞检测蒸馏

合成辅助预训练和补丁级特征对齐的多类别宫颈病变细胞检测蒸馏

神经网络的整体架构

背景与研究意义

宫颈癌是一种严重威胁女性生命和健康的疾病。根据国际癌症研究机构(IARC)的数据显示,2020年全球新增宫颈癌病例约为60.4万例,死亡病例约为34.2万例(Sung et al., 2021)。早期诊断和筛查宫颈癌能够有效预防和治疗,而延误诊断则会增加严重并发症和生命危险的风险(Schiffman, Castle, Jeronimo, Rodriguez, & Wacholder, 2007)。目前,全球各地的健康组织均推荐进行早期筛查作为预防和治疗宫颈癌的一种有效方法(A. C. of Obstetricians, Gynecologists et al., 2010)。其中,液基薄层细胞检测(TCT)是检测宫颈异常和癌前病变最常用且最有效的筛查方法(Davey et al., 2006)。

然而,TCT 检查过程中处理全视野图像(WSI)的传统人工阅片方法不仅耗时,而且易出错,并且不同阅片者之间的诊断结果常存在较大差异(Bengtsson & Malm, 2014)。鉴于此,自动化宫颈细胞分析方法的开发变得尤为迫切,以帮助细胞学家高效、准确地分析宫颈细胞病理图像,实现客观诊断。

从临床角度来看,宫颈TCT筛查的主要目标是检测WSI图像中的宫颈病变细胞,并根据Bethesda(TBS)系统规则将其分为不同的病变阶段(Nayar & Wilbur, 2017)。然而,由于WSI图像样本数量庞大,宫颈细胞检测的初步步骤要求高灵敏度,以防止漏诊任何异常细胞,这对后续分析至关重要(Zhou et al., 2021)。

近年来,深度学习技术的进展显著提高了宫颈病变细胞检测的效率。如Faster R-CNN(Ren et al., 2015)、RetinaNet(Lin et al., 2017)等。然而,这些方法仍面临若干问题:诸如不完整的标注、类别失衡以及未充分利用细胞间的上下文信息(Zhang, Liu, et al., 2019)。为了解决这些问题,本文提出了一种基于蒸馏的框架,旨在通过补丁级别的预训练网络来指导图像级别的检测网络的训练。

来源简介

本文题为《Distillation of Multi-Class Cervical Lesion Cell Detection via Synthesis-Aided Pre-Training and Patch-Level Feature Alignment》,由上海交通大学生物医学工程学院的Manman Fei、Zhenrong Shen、Zhiyun Song、Xin Wang、Linlin Yao、Xiangyu Zhao、Lichi Zhang(*通讯作者)与上海科技大学生物医学工程学院的Maosong Cao、Qian Wang合作完成。文章发表在2024年《Neural Networks》期刊上。

研究工作详细介绍

研究流程

该研究包含多项重要步骤和方法:

  1. 补丁级别的平衡预训练模型(BPM)设计

    • 研究中提出了一种名为平衡预训练模型(Balanced Pre-Training Model,BPM)的补丁级宫颈细胞分类模型。使用一种图像合成模型构建了一个类平衡的补丁数据集进行预训练。
    • 使用CellGAN生成合成数据,确保训练数据的类别分布平衡,从而缓解类别失衡问题。
    • 训练过程包括两阶段:首先使用合成数据进行初始训练,然后使用真实数据微调模型。
  2. 分数校正损失(SCL)

    • 通过设计分数校正损失(Score Correction Loss, SCL)使得检测网络能够从BPM模型中蒸馏知识,从而减轻标注不完全的问题。
    • SCL旨在校正检测模型的置信分数,通过比较BPM预测的补丁分数和检测网络的输出分数来实现这一目的。
  3. 补丁关联一致性策略(PCC)

    • 设计了补丁关联一致性(Patch Correlation Consistency, PCC)策略,以利用提取细胞的关联信息,增强检测过程中特征表示的学习。
    • PCC通过计算检测网络和BPM网络提取的特征之间的一致性来捕获细胞间的上下文关系。

主要结果

实验结果

实验在公共和私有数据集上验证了所提出方法的优越性能:

  1. ComparisionDetector数据集

    • 该数据集包含了7410张宫颈细胞病理图像。实验结果表明,结合该蒸馏框架的DINO检测器在该数据集上取得了令人满意的结果,平均精度(AP)达到24.6,AP@0.5为44.7,AP@0.75为23.6,平均召回率(AR)为46.6。
    • 与现有最优方法相比,本文的方法在AP、AP@0.5、AP@0.75和AR方面分别提高了4.0、3.2、5.9和8.5。
  2. DST数据集

    • 该数据集来自于合作医院,包含3807张由WSI裁剪得来的1024×1024像素的图像。实验结果显示,结合本文提出方法的DINO检测器表现优异,AP达到15.4,AP@0.5为26.3,AP@0.75为16.5,AR为45.1。
    • 与原始DINO模型相比,本文的方法在AP、AP@0.5、AP@0.75和AR方面都有显著提升。

消融实验

为了验证各组成部分的有效性,进行了一系列消融实验。研究结果表明,平衡预训练模型(BPM)、分数校正损失(SCL)和补丁关联一致性策略(PCC)各有重要作用。特别是结合合成数据的BPM模型可以显著提高分类网络的准确性,从而增强检测模型的整体精度。

结论与意义

本文通过提出一种新颖的蒸馏框架,解决了宫颈细胞检测中的若干关键问题。通过结合补丁级分类网络以及分数校正和补丁关联策略,本文的方法显著改进了现有检测器在多类别宫颈病变细胞检测中的性能。这不仅在科学上具有重要价值,还有助于实际临床应用中宫颈癌高通量筛查方法的进一步发展。

研究亮点

  • 新颖的蒸馏框架:利用补丁级分类网络指导图像级检测网络的训练,首次在蒸馏方法中结合宫颈癌细胞分类网络优化异常细胞检测。
  • 解决多重问题:有效解决了不完全标注、类别失衡和细胞间关系未被充分利用等问题。
  • 灵活的通用性:该方法可无缝应用于各种检测器,并且不需要在推理阶段改变其结构。

本文的研究结果表明,使用本文提出的方法进行宫颈异常细胞检测,不仅提高了检测精度,还为实际临床应用提供了宝贵的技术支持,具有广泛的潜在应用价值。