分享自:

基于近红外光谱和随机森林变量选择的大豆裂纹种子鉴别方法

期刊:infrared physics & technologyDOI:10.1016/j.infrared.2021.103731

这篇文档属于类型a,即报告了一项原创性研究。以下是基于文档内容生成的学术报告:

作者与机构
本研究的作者为Liusan Wang、Ziliang Huang和Rujing Wang,均来自中国科学院智能机械研究所和安徽省智能农业工程实验室。该研究发表于2021年3月29日的期刊《Infrared Physics & Technology》上,论文标题为《Discrimination of cracked soybean seeds by near-infrared spectroscopy and random forest variable selection》。

学术背景
大豆是一种重要的经济作物,其种子在收获、运输、储存和处理过程中可能因人工干燥或机械损伤而出现裂纹。裂纹种子会影响储存、发芽和出苗率,因此在储存和播种前准确识别裂纹种子至关重要。传统的视觉检测方法存在主观性、不一致性和速度慢的问题,而化学方法则具有破坏性和耗时的缺点。近年来,近红外光谱(Near-Infrared Spectroscopy, NIR)技术因其快速、无损的特点,在种子质量检测中得到了广泛应用。本研究旨在提出一种基于近红外光谱和随机森林(Random Forest, RF)变量选择的方法,用于区分裂纹大豆种子和正常大豆种子。

研究流程
1. 样品准备
研究使用了200粒大豆种子,分为三组:100粒正常种子、75粒人工裂纹种子和25粒自然裂纹种子。人工裂纹种子通过将正常种子浸泡在水中15分钟后在105°C的烘箱中干燥2小时制备而成。

  1. 近红外光谱采集
    使用傅里叶变换近红外光谱仪(FT-NIR Spectrometer)在5793–12,489 cm⁻¹波长范围内以16 cm⁻¹的分辨率采集光谱数据。每粒种子测量两次(正面和背面),取平均值用于后续分析。

  2. 光谱预处理
    采用Savitzky-Golay(SG)平滑的一阶导数对光谱数据进行预处理,以减少与样品信息无关的变异性。

  3. 主成分分析(PCA)
    对预处理后的光谱数据进行主成分分析,以降低数据维度并揭示光谱数据的内部结构。前五个主成分解释了总方差的89%。

  4. 随机森林分类模型
    使用随机森林算法对预处理后的光谱数据进行分类。150粒种子(75粒正常和75粒裂纹)用于训练和验证集,50粒种子(25粒正常和25粒自然裂纹)用于测试集。模型在测试集上的分类准确率为80%。

  5. 随机森林变量选择
    为了提高模型性能,研究采用了三种随机森林变量选择方法:递归特征消除(Recursive Feature Elimination, REF)、Boruta和VarselRF。这些方法分别选择了47、49和2个波数变量,主要集中在7066和10,522 cm⁻¹附近。REF方法在测试集上的分类准确率最高,达到84%。

主要结果
1. 光谱分析
预处理后的光谱数据显示,裂纹种子和正常种子在5793–8686 cm⁻¹范围内存在明显差异。

  1. 主成分分析
    PCA未能清晰区分裂纹种子和正常种子,表明需要进一步的监督分类模型。

  2. 随机森林分类
    随机森林模型在测试集上的分类准确率为80%,优于支持向量机(SVM)和K近邻(K-NN)模型。

  3. 变量选择
    REF方法在测试集上的分类准确率最高(84%),且选择的主要波数变量与水分、无定形纤维素和纤维含量相关,表明这些成分是区分裂纹种子和正常种子的主要因素。

结论
本研究提出了一种基于近红外光谱和随机森林变量选择的方法,用于区分裂纹大豆种子和正常大豆种子。研究结果表明,该方法在测试集上的分类准确率达到84%,优于传统的视觉检测和化学方法。主要选择的波数变量与水分、无定形纤维素和纤维含量相关,表明这些成分在区分裂纹种子和正常种子中起到了重要作用。该方法的成功应用为大豆种子质量的自动化检测提供了新的可能性。

研究亮点
1. 创新性方法
本研究首次将随机森林变量选择方法应用于近红外光谱分析,用于区分裂纹大豆种子和正常大豆种子。

  1. 高分类准确率
    REF方法在测试集上的分类准确率达到84%,显著优于传统方法。

  2. 重要发现
    研究揭示了水分、无定形纤维素和纤维含量在区分裂纹种子和正常种子中的关键作用。

其他有价值的内容
研究还表明,使用更宽波长范围(如350–2500 nm)的光谱仪可能进一步提高分类模型的准确性和鲁棒性。此外,未来研究可以纳入更多大豆样品和品种,以验证方法的普适性。

资助与声明
本研究得到了国家重点研发计划(2018YFD0101004)的资助。作者声明无任何已知的竞争性财务利益或个人关系可能影响本研究报告的内容。

致谢
作者感谢Qi Wang博士提供的FT-NIR光谱仪支持。

补充数据
补充数据可在https://doi.org/10.1016/j.infrared.2021.103731在线获取。

参考文献
文中引用了大量相关文献,涵盖了近红外光谱、随机森林算法以及大豆种子质量检测等领域的研究成果。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com