分享自:

基于皮肤镜图像的极端学习机器混合器及其在皮肤癌检测中的应用

期刊:arabian journal for science and engineeringDOI:10.1007/s13369-024-09900-y

本文档属于类型a,即一篇报告单一原创研究的学术论文。以下是基于文档内容的详细学术报告:

作者及机构

本研究的主要作者包括Nebras Sobahi、Abdulsalam M. Alhawsawi、Mohammed M. Dammoom和Abdulkadir Sengur。研究团队来自多个机构,包括King Abdulaziz University、King Fahd University of Petroleum & Minerals以及Firat University。该研究发表在《Arabian Journal for Science and Engineering》期刊上,于2024年12月23日被接受。

学术背景

本研究的主要科学领域是电气工程,特别是人工智能(AI)在医学图像分析中的应用。皮肤癌是一种由皮肤细胞异常生长引起的严重疾病,通常与过度的紫外线暴露有关。皮肤镜检查(dermoscopy)帮助医生检查皮肤病变,有助于发现肉眼难以识别的良性和恶性病变。近年来,开发基于人工智能的计算机辅助诊断系统以帮助皮肤癌诊断引起了广泛关注。然而,现有的深度学习方法通常训练复杂度高,限制了其在实际应用中的效率。因此,本研究旨在开发一种新型的AI方法——极端学习机混合器(Extreme Learning Machine-Mixer, ELM-Mixer),并将其应用于基于皮肤镜图像的皮肤癌检测。ELM-Mixer的独特之处在于其单次学习(single-pass learning)方法,能够显著减少训练时间和计算复杂度。

研究流程

  1. 模型开发
    ELM-Mixer的架构包括以下几个部分:

    • Patch Embedding:将输入图像分割为不重叠的16×16像素块,并通过线性投影层将其转换为嵌入向量。
    • Mixer Layer:包含层归一化(Layer Normalization)、Token混合和通道混合操作。Token混合层用于在图像的不同空间区域之间交换信息,而通道混合层则用于在特征通道之间进行信息融合。
    • ELM Head Layer:通过经典的Moore-Penrose矩阵逆运算计算网络输出。
      ELM-Mixer的核心特点是其训练过程无需反向传播(backpropagation),而是通过随机初始化隐藏层权重并使用Moore-Penrose逆技术计算输出权重,从而显著降低了计算复杂度。
  2. 数据集
    实验使用了HAM10000皮肤癌数据集,该数据集包含10,015张皮肤镜图像,涵盖了多种良性和恶性皮肤病变。为了解决类别不平衡问题,研究采用了过采样和欠采样技术,并通过Keras数据增强方法对图像进行随机旋转、平移、缩放和翻转等操作。

  3. 实验设置
    实验在MATLAB软件中进行,使用了两台不同的计算配置。训练集和测试集分别占数据集的85%和15%。模型的性能通过精确率(Precision)、召回率(Recall)、准确率(Accuracy)、特异性(Specificity)和F1分数(F1-Score)等指标进行评估。

  4. 性能评估
    实验结果表明,ELM-Mixer在皮肤癌分类任务中表现优异,整体精确率为94.7%,召回率为94.6%,准确率为94.6%,特异性为99.1%,F1分数为94.6%。与现有的最先进方法(如MLP-Mixer和ConvMixer)相比,ELM-Mixer在性能上具有显著优势,并且训练时间更短。

主要结果

  1. 模型性能
    ELM-Mixer在HAM10000数据集上的表现优于其他对比模型。例如,在分类AKIEC(光化性角化病和上皮内癌)时,模型的精确率达到96.07%,召回率为94.12%,F1分数为95.09%。在分类BCC(基底细胞癌)时,模型的精确率为94.90%,召回率为95.80%,F1分数为95.35%。

  2. 训练效率
    ELM-Mixer的训练时间仅为117.49秒,显著低于MLP-Mixer(294.24秒)和ConvMixer(324.97秒)。这表明ELM-Mixer在计算效率上具有明显优势,适合实时应用或计算资源有限的环境。

  3. 数据增强
    研究还采用了条件生成对抗网络(Conditional Generative Adversarial Networks, CGANs)进行数据增强,进一步提高了模型的性能。例如,在CGAN增强后的数据集上,ELM-Mixer在分类VASC(血管病变)时的F1分数达到97.30%。

结论

本研究提出了一种新型的ELM-Mixer模型,用于基于皮肤镜图像的皮肤癌检测。ELM-Mixer通过结合极端学习机(ELM)和混合器架构,显著降低了训练复杂度,并提高了分类性能。实验结果表明,ELM-Mixer在HAM10000和ISIC-2017数据集上的表现优于现有的最先进方法,具有较高的精确率、召回率和准确率。此外,ELM-Mixer的训练时间更短,适合实时应用。该研究为皮肤癌的自动化诊断提供了一种高效且准确的解决方案,具有重要的科学和应用价值。

研究亮点

  1. 创新性
    ELM-Mixer是首次将极端学习机(ELM)与混合器架构结合,用于皮肤癌分类任务。其独特的训练方法无需反向传播,显著降低了计算复杂度。

  2. 高效性
    与现有的深度学习方法相比,ELM-Mixer在训练时间和计算效率上具有显著优势,适合在计算资源有限的环境中应用。

  3. 鲁棒性
    ELM-Mixer在多个皮肤癌分类任务中表现出色,特别是在处理类别不平衡问题时,通过数据增强技术进一步提高了模型的鲁棒性。

其他有价值的内容

研究还探讨了ELM-Mixer在不同patch大小和模型深度下的性能表现。结果表明,16×16的patch大小在捕捉图像细节和计算效率之间取得了最佳平衡。此外,增加混合器层数虽然能略微提高准确率,但也会增加训练时间和过拟合风险。这些发现为未来优化ELM-Mixer架构提供了重要参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com