分享自:

基于关系探索卷积块注意力模块的皮肤病变分类研究

期刊:international journal of imaging systems and technologyDOI:10.1002/ima.70002

本文档属于类型a,即报告了一项原创研究。以下是对该研究的详细介绍:

作者及发表信息
本研究由Qichen Su、Haza Nuzly Abdull Hamed和Dazhuo Zhou共同完成。Qichen Su和Haza Nuzly Abdull Hamed来自马来西亚理工大学(Universiti Teknologi Malaysia, UTM)的计算机学院,Dazhuo Zhou来自中国惠州学院(Huizhou University)的数学与统计学院。该研究发表于2025年的《International Journal of Imaging Systems and Technology》期刊,文章链接为https://doi.org/10.1002/ima.70002。

学术背景
皮肤癌,尤其是黑色素瘤,是全球健康的重要威胁之一。早期诊断对提高治疗效果至关重要。近年来,卷积神经网络(Convolutional Neural Networks, CNNs)在计算机视觉领域的进展为皮肤病变的自动诊断提供了可能性。然而,由于皮肤病变区域在图像中占比较小,且不同类别之间的视觉差异有限,自动诊断仍然面临挑战。准确分类依赖于病变的精确定位和细粒度视觉差异的识别。为此,本研究提出了一种改进的卷积块注意力模块(Convolutional Block Attention Module, CBAM),称为关系探索卷积块注意力模块(Relation Explore Convolutional Block Attention Module, RECBAM),旨在通过多池化注意力组合提升模型对复杂特征关系的捕捉能力,从而提高皮肤病变分类的准确性。

研究流程
研究流程包括以下几个主要步骤:
1. RECBAM模块的设计与实现
RECBAM模块由通道注意力模块(Channel Attention Module)和空间注意力模块(Spatial Attention Module)组成。通道注意力模块通过平均池化(Average Pooling)和最大池化(Max Pooling)生成空间上下文描述符,并通过多层感知机(Multi-Layer Perceptron, MLP)生成注意力图。这些注意力图通过加法和乘法操作组合,生成最终的通道注意力图。空间注意力模块则通过通道轴上的池化操作生成特征描述符,并通过卷积层生成注意力图,同样通过加法和乘法操作组合生成最终的空间注意力图。
2. RECBAM与ResNet50的集成
为了增强模型对皮肤病变图像的细粒度特征捕捉能力,研究将RECBAM集成到ResNet50架构中。ResNet50因其在皮肤病变分类领域的广泛应用和有效性而被选为基线模型。RECBAM被策略性地集成到ResNet50的第3和第5阶段,以减少过拟合风险并增强模型的可解释性。
3. 数据集与实验设置
研究使用公开的HAM10000数据集进行评估,该数据集包含10,015张皮肤病变图像,分为七类。研究采用五折交叉验证(Fivefold Cross-Validation)方法,所有模型均使用ImageNet预训练参数初始化,学习率为0.02,批量大小为128。数据增强技术包括随机裁剪和水平翻转。
4. 性能评估
研究通过准确率(Accuracy)、灵敏度(Sensitivity)、精确率(Precision)、F1分数(F1-Score)和特异性(Specificity)等指标评估模型性能。RECBAM-ResNet50在HAM10000数据集上取得了显著优于基线模型和其他注意力机制的分类结果。

主要结果
1. RECBAM集成方法的效果
将RECBAM集成到ResNet50的第3和第5阶段时,模型性能最佳,准确率达到97.63%,灵敏度为82.86%,精确率为88.98%,F1分数为85.46%,特异性为97.65%。
2. 与其他注意力模型的对比
与ResNet50、ResNet50+SENet和ResNet50+CBAM相比,RECBAM-ResNet50在各项指标上均表现出显著优势,特别是在黑色素瘤(Melanoma, MEL)和痣(Nevus, NV)的分类上,准确率分别提高了1.58%和1.73%。
3. 定性评估
通过Grad-CAM(Gradient-weighted Class Activation Mapping)可视化,RECBAM-ResNet50能够更准确地定位病变区域,增强了模型的可解释性。

结论
本研究提出的RECBAM模块通过结合加法和乘法池化注意力组合,显著提升了皮肤病变分类的准确性。RECBAM-ResNet50在HAM10000数据集上取得了优异的分类性能,并通过增强模型的可解释性,为临床诊断提供了可靠的支持。该研究的科学价值在于提出了一种新颖的注意力机制,其应用价值在于为皮肤病变的自动诊断系统提供了高效且准确的解决方案。

研究亮点
1. 新颖的注意力机制
RECBAM通过探索加法和乘法池化注意力组合的交互关系,显著提升了模型的特征表示能力。
2. 策略性集成
将RECBAM集成到ResNet50的第3和第5阶段,既减少了过拟合风险,又增强了模型的可解释性。
3. 显著的性能提升
RECBAM-ResNet50在皮肤病变分类任务中取得了优于现有注意力机制的性能,特别是在黑色素瘤和痣的分类上表现突出。

其他有价值的内容
研究还探讨了RECBAM在小型数据集上的优化潜力,建议未来研究可以通过正则化技术(如L1和L2正则化)进一步减少过拟合风险,并通过与轻量级网络(如MobileNet和MnasNet)的集成,提升模型在资源受限设备上的应用能力。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com