这篇文档属于类型a,即报告了一项原创研究。以下是对该研究的学术报告:
本研究由Xiantao He、Liwei Liu、Chenxu Liu、Wei Li、Jialu Sun、Hongsheng Li、Yong He、Li Yang、Dongxing Zhang、Tao Cui、Chen Chen和Jinlong Li共同完成。研究机构包括中国农业大学的工程学院、农业部的土壤-机器-植物重点实验室,以及浙江大学生物系统工程与食品科学学院。研究发表在Biosystems Engineering期刊上,于2022年9月2日在线发表。
本研究的主要科学领域是农业工程和光谱成像技术,特别是近红外高光谱成像(Near-Infrared Hyperspectral Imaging, NIR-HSI)在玉米单倍体种子鉴别中的应用。玉米是全球重要的粮食作物,单倍体加倍(Doubled Haploid, DH)技术是加速玉米育种进程的关键方法。然而,单倍体种子在自然界的发生率极低,人工诱导后也仅有约10%的成功率。因此,快速、准确地从大量二倍体种子中分离单倍体种子对于提高育种效率至关重要。传统的鉴别方法依赖于颜色标记和油含量标记,但这些方法存在误差率高、操作繁琐、成本高等问题。本研究旨在探索NIR-HSI技术在玉米单倍体种子鉴别中的适用性,并结合多元分析方法优化波长选择,以提高鉴别效率和准确性。
研究流程主要包括以下几个步骤:
样品准备:研究使用了400粒玉米种子,分为两组:一组为颜色标记的种子(Tyd1903和Tyd1904),另一组为油含量标记的种子(Tyd1907和Tyd1908)。每组各100粒种子,分别进行胚胎和非胚胎面的高光谱成像。
高光谱图像采集:使用线扫描NIR-HSI系统对种子进行高光谱成像,波长范围为874-1734 nm,光谱分辨率为3.36 nm。每粒种子在胚胎面和非胚胎面各扫描一次,共采集256幅图像。
化学成分测定:使用核磁共振(NMR)仪器测定所有种子的实际油含量,并通过pH差示法测定花青素含量。这些化学成分为后续的光谱分析提供了参考数据。
光谱数据处理:对采集到的高光谱图像进行校准和去噪处理,提取每粒种子的光谱数据,并使用Savitzky-Golay(SG)方法进行预处理,以减少高频噪声。
分类模型建立:采用偏最小二乘判别分析(Partial Least Square-Discriminant Analysis, PLSDA)建立单倍体和二倍体种子的分类模型。为了优化模型,研究使用了三种变量选择方法:子窗口置换分析(Sub-window Permutation Analysis, SPA)、竞争性自适应重加权采样(Competitive Adaptive Reweighted Sampling, CARS)和无信息变量消除(Uninformative Variables Elimination, UVE),以筛选出与单倍体和二倍体种子差异指数相关的最优波长。
模型验证与优化:通过交叉验证和蒙特卡洛模拟,评估不同变量选择方法的分类准确性,并最终确定20个最优波长,建立PLSDA模型。
研究的主要结果如下:
光谱特征与化学成分:研究发现,单倍体和二倍体种子在花青素含量和油含量上存在显著差异。颜色标记的种子中,二倍体种子的花青素含量普遍高于单倍体种子;油含量标记的种子中,二倍体种子的油含量也显著高于单倍体种子。
主成分分析(PCA):PCA结果显示,单倍体和二倍体种子在光谱数据上存在明显的聚类差异,胚胎面和非胚胎面的光谱距离大于单倍体和二倍体之间的光谱距离。
变量选择与模型优化:通过SPA、CARS和UVE三种方法,分别筛选出114、27和49个最优波长。最终,结合这三种方法,确定了20个最优波长,建立的PLSDA模型在验证集上的准确率达到90.31%,高于使用全波长的PLSDA模型(89.06%)。
分类模型的应用:研究表明,基于NIR-HSI技术的分类模型不仅适用于颜色标记和油含量标记的种子,还能在种子胚胎面和非胚胎面不一致的情况下实现高精度鉴别,显著提高了单倍体种子筛选的效率和实用性。
本研究证明了NIR-HSI技术在玉米单倍体种子鉴别中的巨大潜力和广泛应用前景。通过结合多元分析方法,研究成功筛选出20个最优波长,建立的PLSDA模型在单倍体和二倍体种子鉴别中表现出色。这一方法不仅提高了鉴别效率,还降低了计算负担,为大规模工业化的单倍体种子筛选提供了理论指导和技术支持。未来研究可以进一步优化模型,消除品种、地理来源和农艺条件等因素的影响,以构建更稳健的分类模型。
研究还探讨了不同标记方法(颜色标记和油含量标记)以及种子胚胎方向对分类模型的影响,为未来研究提供了新的思路和方向。此外,研究提出的变量选择方法(SPA、CARS和UVE)也为其他光谱成像研究提供了参考。