分享自:

基于高光谱成像和注意力卷积神经网络的单粒玉米籽粒含油量预测

期刊:Food ChemistryDOI:10.1016/j.foodchem.2022.133563

该文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


主要作者及研究机构
本研究由Liu Zhang、Dong An、Yaoguang Wei、Jincun Liu和Jianwei Wu共同完成。研究团队分别来自中国农业大学的国家数字渔业创新中心、农业农村部智能养殖技术重点实验室、北京农业物联网工程技术研究中心、中国农业大学信息与电气工程学院,以及国家农业信息化工程技术研究中心。该研究发表于2022年6月23日的《Food Chemistry》期刊,文章编号为133563。

学术背景
本研究属于食品化学与光谱分析领域,主要关注玉米籽粒中油含量的快速无损检测。玉米油因其颜色浅、质地轻、风味稳定且烟点高,广泛用于沙拉油和烹饪油。然而,普通玉米籽粒的油含量通常仅为4%左右,甚至更低。为了提高玉米油含量,育种专家通过选择性育种开发了高油玉米品种。然而,传统的油含量检测方法(如核磁共振法)存在成本高、分析速度慢等问题,而近红外光谱(NIR)技术虽具有无损、快速和低成本的优势,但其单点测量方式可能无法全面反映样品的异质性结构。因此,本研究提出将高光谱成像(HSI)技术与深度学习(DL)相结合,开发一种基于注意力卷积神经网络回归(ACNNR)模型的方法,以实现单粒玉米籽粒油含量的快速预测。

研究目标
本研究的主要目标包括:
1. 比较玉米籽粒胚面和非胚面光谱的建模性能;
2. 基于传统建模流程(光谱预处理、降维和PLS回归)建立最优混合模型;
3. 构建两种卷积神经网络回归(CNNR)模型,一种包含注意力机制,另一种不包含,并使用原始光谱作为输入;
4. 比较传统方法与深度学习方法的表现,并探讨注意力机制是否有助于提升网络性能;
5. 基于最优模型可视化单粒玉米籽粒中各像素的油含量分布。

研究流程
1. 样本采集与处理
研究选取了中国广泛推广的两个玉米品种(郑单958和农大616),包括高油玉米和普通玉米,共400粒玉米籽粒。所有样本在相同条件下种植和收获,并储存在干燥环境中。

  1. 高光谱图像采集与校正
    使用反射模式的高光谱成像系统采集玉米籽粒胚面和非胚面的高光谱图像。系统包括N17E成像光谱仪、溴钨灯光源、传送带和计算机。采集前进行系统预热和参数调试,最终确定最佳曝光时间为9毫秒,传送带速度为6.0厘米/秒,镜头高度为35厘米。为避免外部光干扰,数据采集在光学暗室中进行。采集后通过黑白校正公式对原始图像进行校正。

  2. 参考油含量测定
    使用核磁共振(NMR)技术测定所有玉米籽粒的参考油含量。每个样本测量两次,取平均值作为参考值。

  3. 光谱数据提取与预处理
    从校正后的高光谱图像中提取玉米籽粒的光谱数据。通过阈值分割构建掩膜,定义每个籽粒的感兴趣区域(ROI),并计算ROI内所有像素的平均反射率作为光谱数据。由于光谱数据在起始和结束波段存在严重失真,研究仅保留911.2–1653.8 nm范围内的226个波长。进一步采用标准正态变量变换(SNV)、Savitzky-Golay平滑(SG)、一阶导数(SG1)和二阶导数(SG2)等方法对光谱进行预处理。

  4. 异常值检测与样本集划分
    使用基于PLS分解的Q残差和Hotelling’s T2统计量检测异常值。结果显示无显著异常值,最终400个样本全部用于建模。将样本随机分为300个校准集和100个预测集。

  5. 回归模型建立与评估

    • PLS回归模型:采用留一法交叉验证选择最佳潜变量(LVs),并比较不同预处理方法的效果。
    • 深度学习回归模型:构建CNNR和ACNNR模型,使用原始光谱作为输入,采用均方误差(MSE)作为损失函数,Adam优化器进行训练。ACNNR模型在CNNR基础上增加了注意力机制,以增强对关键特征的关注。
    • 模型性能评估:使用决定系数(R2)、均方根误差(RMSE)和残差预测偏差(RPD)评估模型性能。
  6. 降维方法比较
    比较了传统降维方法(SPA、CARS和PCA)与深度学习方法(CNN和ACNN)在PLS回归模型中的表现。

  7. 油含量分布可视化
    使用最优模型预测单粒玉米籽粒中各像素的油含量,并通过伪彩色图展示油含量分布。

主要结果
1. 光谱特征分析
玉米籽粒胚面的平均光谱反射率高于非胚面,且在1350–1650 nm范围内差异最大,这与蛋白质和油的吸收峰相关。

  1. 模型性能比较

    • PLS回归模型中,SNV预处理方法表现最佳,胚面光谱的预测结果显著优于非胚面光谱。
    • CNNR和ACNNR模型在胚面光谱上的表现优于PLS回归模型,其中ACNNR模型的预测决定系数(Rp2)达到0.9198,RPD为3.5495,表现最佳。
    • 在降维方法比较中,SPA、CNN和ACNN均提升了PLS回归模型的性能,其中ACNN-PLSR模型的RPD达到3.4952。
  2. 油含量分布可视化
    可视化结果显示,高油玉米籽粒的油含量显著高于普通玉米籽粒,且油主要集中在胚部,与实际分布一致。

结论
本研究提出了一种基于高光谱成像和注意力卷积神经网络回归模型的方法,成功实现了单粒玉米籽粒油含量的快速无损预测。与传统方法相比,深度学习方法无需复杂的光谱预处理和降维步骤,且通过注意力机制进一步提升了模型性能。该方法为玉米育种和食品工业提供了一种高效、可靠的油含量检测工具,具有重要的科学和应用价值。

研究亮点
1. 首次将注意力机制引入卷积神经网络回归模型,显著提升了油含量预测的准确性。
2. 通过高光谱成像技术实现了单粒玉米籽粒油含量的可视化分布,为育种和品质检测提供了直观依据。
3. 深度学习模型在无需复杂预处理的情况下,表现优于传统化学计量学方法,为光谱分析领域提供了新的建模思路。

其他有价值内容
本研究还探讨了不同激活函数(如ReLU和ELU)在小规模数据集中的表现,发现ELU更适合小规模数据集的回归任务,避免了“死亡ReLU”现象。此外,研究强调了品种、环境和农艺条件对玉米籽粒油含量的影响,建议在实际应用中定期更新模型以适应不同条件下的样本。


以上为针对该研究的详细学术报告。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com