基于CNN与扩张采样自注意力和特征交互Transformer的ABVS乳腺肿瘤分割
基于CNN与Dilated Sampling Self-Attention的ABVS乳腺肿瘤分割研究
学术背景
乳腺癌是全球范围内第二大常见癌症,早期和准确的检测对于改善患者预后和降低死亡率至关重要。尽管目前有多种成像技术(如X线乳腺摄影、磁共振成像和手持超声)被用于乳腺癌的早期筛查,但这些技术往往面临分辨率有限或操作依赖性强等问题。为了解决这些问题,自动化乳腺容积扫描仪(Automated Breast Volume Scanner, ABVS)应运而生。ABVS能够自动获取整个乳房的全面视图,但其图像分析仍然具有挑战性,主要由于乳腺肿瘤在大小、形状和位置上的显著差异。近年来,深度学习在医学图像分析中取得了显著进展,尤其是卷积神经网络(CNN)和变换器(Transformer)在肿瘤分割和检测任务中表现出色。然而,现有的CNN方法在捕捉全局上下文信息方面存在局限性,而纯变换器架构在处理大型3D医学图像时计算成本较高。因此,如何有效结合CNN和变换器的优势,成为当前研究的一个重要方向。
论文来源
本论文由Yiyao Liu、Jinyao Li、Yi Yang等作者共同撰写,作者来自深圳大学健康科学中心生物医学工程学院和华中科技大学深圳联合医院超声科。论文于2025年发表在Neural Networks期刊上,题目为《ABVS Breast Tumour Segmentation via Integrating CNN with Dilated Sampling Self-Attention and Feature Interaction Transformer》。
研究流程
1. 研究设计与网络架构
本研究提出了一种新颖的3D分割网络——DST-C,该网络结合了卷积神经网络(CNN)和扩张采样自注意力变换器(Dilated Sampling Self-Attention Transformer, DST)。网络的核心思想是通过CNN分支提取局部细节信息,并通过DST分支捕捉全局特征,从而实现更精确的肿瘤分割。具体来说,网络由以下几个部分组成:
- CNN分支:采用残差连接网络(Residual Connection Network)提取图像的局部细节特征。
- DST分支:基于Swin Transformer(ST)进行改进,引入了扩张采样自注意力机制,以扩大感受野并降低计算复杂度。
- 空间-通道注意力桥(SCA):用于连接CNN和DST分支,通过空间注意力和通道注意力机制融合局部和全局特征。
- 解码器:将两个分支的特征进行融合,并通过上采样操作恢复图像分辨率。
2. 自监督学习策略
为了解决医学图像标注数据稀缺的问题,本研究提出了一种基于掩码图像建模(Mask Image Modelling, MIM)的自监督学习(Self-Supervised Learning, SSL)策略。具体步骤如下:
- 掩码生成:随机对输入图像进行立方体掩码,掩码大小和比例通过实验确定。
- 特征提取:CNN分支处理未掩码图像,DST分支处理掩码图像,并提取特征。
- 特征重建:通过简单的解码器重建掩码区域,计算特征级和像素级的L1损失,以优化网络。
3. 后处理算法
为了提高肿瘤检测的灵敏度和降低假阳性率,本研究设计了一种自适应阈值局部范围区域生长算法。该算法通过全局和局部最大值的比较,动态调整分割阈值,从而更准确地识别肿瘤区域。
4. 实验与评估
研究在三个数据集上进行了实验:自收集的ABVS数据集、公开的KITS19 CT数据集和TDSC-ABUS 2023 3D乳腺超声数据集。实验结果表明,DST-C网络在ABVS数据集上的分割Dice系数达到73.65%,灵敏度为91.67%,显著优于其他对比方法。在KITS19数据集上,DST-C的肾脏分割Dice系数为98.03%,肾脏肿瘤分割Dice系数为87.24%,也表现出色。
主要结果
- 网络架构的有效性:实验表明,DST-C网络在融合局部细节和全局上下文信息方面表现出色。与单一CNN或ST分支相比,双分支结构显著提高了分割精度。
- 自监督学习的贡献:通过SSL策略,网络在未标注数据上预训练后,分割性能显著提升。最佳掩码大小为4,掩码比例为40%。
- 后处理算法的优化:自适应阈值区域生长算法有效降低了假阳性率,同时保持了较高的灵敏度。
- 多数据集验证:DST-C在ABVS、KITS19和TDSC-ABUS数据集上均表现出色,证明了其泛化能力。
结论与意义
本研究提出的DST-C网络通过结合CNN和DST的优势,成功解决了ABVS图像中乳腺肿瘤分割的难题。其创新点包括: - 双分支结构:有效融合局部细节和全局上下文信息。 - 扩张采样自注意力机制:扩大了变换器的感受野,降低了计算复杂度。 - 自监督学习策略:解决了医学图像标注数据稀缺的问题。 - 自适应后处理算法:提高了肿瘤检测的准确性和灵敏度。
该研究不仅为乳腺肿瘤的自动化分割提供了新的解决方案,还为其他医学图像分割任务提供了有价值的参考。
研究亮点
- 创新性网络架构:DST-C网络首次将CNN与扩张采样自注意力变换器结合,实现了局部与全局特征的有效融合。
- 自监督学习的应用:通过掩码图像建模,充分利用了未标注数据,提升了模型性能。
- 多数据集验证:在多个公开和私有数据集上验证了模型的泛化能力。
- 后处理算法的优化:自适应阈值区域生长算法显著提高了肿瘤检测的准确性。
其他有价值的信息
本研究还探讨了不同掩码大小和比例对自监督学习效果的影响,为未来的相关研究提供了实验依据。此外,研究团队公开了代码,便于其他研究者复现和改进。
本研究为乳腺肿瘤的自动化分割提供了新的思路和方法,具有重要的科学意义和临床应用价值。