本文档属于类型a,即报告了一项原创研究的科学论文。以下是对该研究的学术报告:
本研究的主要作者包括Büşra Gürbüz、Erkan Aras、Abdurrahman Muhammed Güz和Fatih Kahriman*,他们均来自土耳其Çanakkale Onsekiz Mart大学农业学院作物科学系。该研究于2023年4月7日在线发表在期刊《Vibrational Spectroscopy》上,文章编号为103528。
本研究的主要科学领域是近红外光谱(Near Infrared Reflectance, NIR)技术在植物育种中的应用,特别是用于无损检测单粒玉米籽粒中的油分含量。传统的油分检测方法(如湿化学法)需要破坏样品且化学试剂消耗量大,因此在植物育种中开发无损检测方法具有重要意义。近红外光谱技术作为一种替代方法,能够在单粒籽粒水平上无损检测油分含量,具有显著优势。本研究的目的是通过NIR光谱技术开发校准模型,用于预测单粒玉米籽粒中的油分含量,并比较不同化学计量学技术构建的模型的预测能力。
研究使用了来自10个不同基因型的500粒玉米籽粒,这些基因型在油分含量上存在差异(1.11%至10.9%)。这些材料选自Çanakkale Onsekiz Mart大学农业学院作物科学系之前的育种研究。
使用台式NIR设备(SpectraStar 2400D, Unity Scientific, USA)在8333至4166 cm⁻¹的波长范围内采集光谱数据。每粒籽粒的胚芽侧被标记并单独采集光谱数据,数据以JDX格式保存,并转换为CSV文件用于后续建模。
每粒籽粒被单独研磨,使用己烷提取油分,并通过氮气蒸发溶剂后称重,计算油分含量。油分含量的测定结果作为参考值用于模型校准。
使用SelectWave应用程序(基于R语言开发)进行光谱预处理和模型开发。共开发了360个模型,包括5种预处理方法、4种导数选项和9种波长选择方法。模型采用偏最小二乘回归(Partial Least Squares Regression, PLSR)和支持向量机(Support Vector Machine, SVM)两种方法构建。模型开发过程中,使用稳健稀疏主成分分析(Robust Sparse PCA, RoSPCA)算法剔除光谱异常值。最终,样本被随机分为校准集(70%)、外部验证集(20%)和测试集(10%)。
模型的准确性通过校准集、外部验证集和测试集的均方根误差(Root Mean Square Error, RMSE)、决定系数(R²)和相对预测偏差(Relative Prediction Deviation, RPD)进行评估。最佳模型的选择基于这些统计参数。
研究样本的油分含量范围较广(1.11%至10.92%),这为模型开发提供了足够的变异范围。校准集、外部验证集和测试集的平均油分含量分别为6.53%、6.59%和6.64%。
在360个模型中,SVM模型的预测性能优于PLSR模型。最佳SVM模型的预处理组合为none+svm+none,其校准集的RMSE为0.46,R²为95.11,RPD为4.53;外部验证集的RMSE为0.78,R²为84.50,RPD为2.55;测试集的RMSE为0.83,R²为82.59,RPD为2.42。相比之下,最佳PLSR模型的预处理组合为fd+snv+none,其校准集的RMSE为0.76,R²为86.40,RPD为2.72;外部验证集的RMSE为0.97,R²为76.24,RPD为2.06;测试集的RMSE为1.22,R²为6.97,RPD为1.66。
研究表明,光谱预处理、导数处理和波长选择方法的组合对模型成功有显著影响。特别是SVM模型在结合适当预处理方法时,能够显著提高预测性能。此外,使用胚胎区域的光谱数据可以提高模型的预测准确性,因为玉米籽粒中的油分主要集中在该区域。
本研究成功开发了基于NIR光谱技术的校准模型,用于预测单粒玉米籽粒中的油分含量。SVM模型在预测性能上优于PLSR模型,特别是在结合适当的预处理方法时。研究结果表明,NIR光谱技术结合化学计量学方法可以有效地用于单粒玉米籽粒油分含量的无损检测,为植物育种提供了重要工具。
本研究为NIR光谱技术在植物育种中的应用提供了重要参考,展示了其在无损检测单粒玉米籽粒油分含量方面的潜力。