面向医学图像分割的模型异质半监督联邦学习

医学影像分割的模型异质半监督联邦学习

背景介绍

医学图像分割在临床诊断中具有至关重要的作用,它帮助医生识别和分析病情。然而,该任务通常面临敏感数据、隐私问题及昂贵的标注费用等挑战。尽管当前研究主要聚焦于个性化协作训练医学分割系统,但忽视了获取分割标注是耗时且费力的。如何在保持本地模型个性化的同时平衡标注成本和分割性能,已成为研究的一个重要方向。因此,本研究引入了一种新颖的模型异质半监督联邦学习框架。 模型异质性的联邦学习架构

论文来源

这篇论文题为“Model-Heterogeneous Semi-Supervised Federated Learning for Medical Image Segmentation”,由Yuxi Ma、Jiacheng Wang、Jing Yang和Liansheng Wang共同撰写,作者分别隶属于厦门大学国家数据科学与健康医学研究院和厦门大学计算机科学系。论文发表在2024年5月《IEEE Transactions on Medical Imaging》期刊上。

研究方法和过程

工作流程

  1. 研究目标:本研究的主要目标是提出一种在保持模型个性化的情况下,利用无标注数据减少标注负担的模型异质半监督联邦学习(HSSF)框架。

  2. 关键模块:HSSF框架引入了规则凝聚(regularity condensation)和规则融合(regularity fusion)以确保不同站点之间的个性化。此外,还提出了自评估(SA)模块和可靠伪标签生成(RPG)模块,以充分利用无标注数据。

  3. 规则凝聚和规则融合

    • 规则凝聚:服务器根据各站点上传的模型表现,选择最接近真值的规则进行凝聚,并将这些规则广播给所有站点。
    • 规则融合:每个站点根据自身需要选择部分有益的规则进行融合。
  4. 半监督学习

    • SA模块实时生成自我评估信心,用于检测模型预测的准确性。
    • RPG模块根据SA信心生成可靠的伪标签。这两个模块结合使用,能够提高无标注数据的训练效率。

实验设计

我们在皮肤病变和息肉病变数据集上分别进行模型评估,通过实验结果展示了HSSF模型在异质设计中优于其他方法,即使在同质设计中也表现出色,特别是在区域评估指标上。

算法详细

HSSF的工作流可以作为以下几步:

  1. 数据准备:准备一个公共数据集和多个本地数据集。公共数据集用于共享知识,本地数据集只用来进行本地操作并保持私有。
  2. 规则凝聚:在每个通信周期内,服务器首先从所有本地模型中选择最优规则进行凝聚。
  3. 本地模型的更新:每个站点根据自身需要选择性地融合这些规则,然后使用本地无标注数据进行自我训练,以更新自身模型。

半监督学习的具体方法

  1. 有标注训练:首先对公共数据集进行监督训练,训练模型和SA模块,使其能够有效地生成自评估信心。
  2. 无标注自我训练:利用SA模块生成的信心评分修正伪标签,提高伪标签的可靠性。通过一致性正则化和自我训练两种方式,对本地无标注数据进行训练。

研究结果

  1. 评估指标:使用Dice系数和Hausdorff距离作为主要评估指标,来量化模型的分割性能。结果表明,HSSF在所有考虑的案例中均表现出色。

  2. 比较实验:将HSSF与同质和异质模型的其他最先进联邦学习方法进行了比较,实验结果证实了HSSF的有效性和优越性。

  3. 消融实验:通过消融实验验证了各个模块的有效性,证明了SA模块和RPG模块在不同情境下均能显著提升模型性能。

研究结论

本研究提出的HSSF框架在医学图像分割任务中展示了优越的性能。通过引入SA模块和RPG模块,模型能够自我评估和修正伪标签,提高无标注数据的利用效率。同时,HSSF框架中独特的规则凝聚和规则融合机制,确保了不同站点的模型个性化,实现了在联邦学习中的有效知识共享。 HSSF不仅在医学图像分割任务中取得了显著的进展,还为未来的跨站点协作学习提供了有效的解决方案。通过减少标注负担、保护数据隐私和提高模型个性化,该框架在实际应用中具有很高的潜力和价值。