PICK:基于预测与掩码的半监督医学图像分割方法
PICK模型在半监督医学图像分割中的应用
学术背景
医学图像分割在临床实践中具有重要意义,能够为医生提供关于器官或肿瘤的体积、位置和形状等关键信息。近年来,基于深度学习的模型在医学图像分割任务中表现出色,但这些模型通常需要大量的标注数据。然而,医学图像的标注需要专业的临床医生,获取这些标注数据既耗时又昂贵。因此,如何在有限的标注数据下提高模型性能成为了一个重要的研究问题。
半监督学习(Semi-Supervised Learning, SSL)通过同时利用有限的标注数据和大量的未标注数据,成为解决这一问题的有效方法。现有的SSL方法主要分为两类:伪标签(Pseudo-labeling)和基于一致性的协同训练(Consistency-based Co-training)。然而,这些方法在处理未标注数据时,往往会引入错误的预测,从而影响模型的性能。为了解决这一问题,本文提出了一种新的半监督医学图像分割模型——PICK(Predict and Mask for Semi-Supervised Medical Image Segmentation),通过掩码和重建伪标签引导的注意力区域,有效地利用未标注数据。
论文来源
本文由Qingjie Zeng、Zilin Lu、Yutong Xie和Yong Xia共同撰写,分别来自西北工业大学国家航空航天海洋大数据应用技术工程实验室、澳大利亚阿德莱德大学机器学习研究所、西北工业大学深圳研究院和宁波研究院。论文于2024年12月9日被《International Journal of Computer Vision》接受,并于2025年正式发表。
研究内容
研究流程
PICK模型的核心思想是通过掩码和重建伪标签引导的注意力区域,从未标注数据中提取有用信息。模型包含一个共享编码器和三个任务特定的解码器:主解码器、掩码图像建模(Masked Image Modeling, MIM)解码器和辅助解码器。
- 主解码器:主解码器仅通过标注数据进行监督,生成未标注数据的伪标签,识别未标注数据中的潜在目标区域。
- MIM解码器:MIM解码器通过掩码和重建目标区域,优化重建任务,从而增强编码器对目标语义的理解。
- 辅助解码器:辅助解码器从重建图像中学习,其预测结果受到主解码器的约束,从而协调分割和重建任务之间的冲突。
实验结果
PICK模型在五个医学图像分割基准数据集上进行了评估,包括单器官/肿瘤分割、多器官分割和领域泛化任务。实验结果表明,PICK在多个任务上均优于现有的最先进方法。例如,在肺肿瘤分割任务中,PICK在使用20%标注数据的情况下,Dice系数比最佳竞争对手CauSSL高出2.46%。
结论与意义
PICK模型通过引入伪标签引导的区域掩码和重建任务,提出了一种新的半监督学习方法,显著提高了医学图像分割的准确性。该方法不仅解决了现有SSL方法中伪标签错误传播的问题,还通过MIM任务增强了编码器的特征表示能力。PICK的成功应用为医学图像分割领域提供了一种高效且鲁棒的解决方案,具有重要的科学和应用价值。
研究亮点
- 新颖的掩码和重建策略:PICK通过掩码和重建伪标签引导的注意力区域,从未标注数据中提取有用信息,显著提高了模型的性能。
- 多解码器设计:PICK通过主解码器、MIM解码器和辅助解码器的协同工作,有效地解决了分割和重建任务之间的冲突。
- 广泛的实验验证:PICK在多个医学图像分割任务中均表现出色,证明了其在不同任务中的通用性和鲁棒性。
其他有价值的信息
PICK模型的代码已在GitHub上开源,研究人员可以访问以下链接获取代码并进行进一步的研究和应用:PICK代码。
总结
PICK模型通过创新的掩码和重建策略,提出了一种新的半监督医学图像分割方法,显著提高了模型的性能。该方法不仅在多个医学图像分割任务中表现出色,还为未来的研究提供了新的思路和方向。随着医学图像分割技术的不断发展,PICK模型有望在临床实践中发挥更大的作用,为医生提供更准确的诊断工具。