这篇文档属于类型a,即报告了一项原创研究。以下是对该研究的学术报告:
主要作者及机构
该研究由David Schütz、Janet Riedl、Elisabeth Achten和Markus Fischer共同完成。其中,David Schütz和Markus Fischer来自德国汉堡大学食品化学研究所(University of Hamburg, Hamburg School of Food Science – Institute of Food Chemistry),Janet Riedl和Elisabeth Achten则来自德国联邦风险评估研究所(German Federal Institute for Risk Assessment, BfR)。该研究于2022年2月15日在线发表在《Food Control》期刊上,文章编号为108892。
学术背景
该研究的主要科学领域是食品真实性验证,特别是饲料材料的来源追溯。玉米是全球贸易中重要的饲料原料,其供应链复杂,传统的追溯工具如运输文件甚至区块链技术可能无法完全保证食品和饲料的真实性。因此,研究团队提出通过实验分析方法直接对商品进行来源验证,以弥补这一缺口。本研究旨在探索傅里叶变换近红外光谱(FT-NIR spectroscopy)作为一种快速、低成本筛查工具,用于验证玉米饲料的地理来源的潜力。研究的目标是通过FT-NIR光谱结合化学计量学建模,开发一种能够根据国家来源对玉米样品进行分类的模型。
研究流程
研究包括以下几个主要步骤:
1. 样品准备
研究使用了来自五个国家(西班牙、乌克兰、斯洛伐克、秘鲁和美国)的101个玉米样品。这些样品经过研磨和均质化处理,以确保样品的均匀性。
2. FT-NIR光谱分析
使用Bruker Optics的Tango NIR光谱仪记录样品的FT-NIR光谱。光谱记录在11,550至3950 cm⁻¹的波数范围内,分辨率为2 cm⁻¹。每个样品测量一次,每次测量由50次扫描组成,分析时间约为1分钟。
3. 数据预处理与多元统计分析
光谱数据首先经过标准正态变量变换(SNV)处理,以消除散射效应。随后,使用主成分分析(PCA)和偏最小二乘判别分析(PLS-DA)对光谱数据进行探索性分析,以识别与地理来源相关的光谱区域。
4. 分类模型构建与优化
研究使用支持向量机(SVM)构建分类模型,并通过网格搜索优化模型参数。模型优化包括预处理方法(如SNV、一阶导数、二阶导数、分箱处理)和核函数(线性、二次、径向基函数)的选择。最终,研究选择了线性核函数和SNV+一阶导数+分箱处理的组合作为最优模型。
5. 化学驱动波数选择
为了进一步验证模型的分类能力,研究基于蛋白质、淀粉和脂质相关的光谱区域构建了多个分类模型,并与全光谱模型进行比较。最终,研究提出了一个结合蛋白质、淀粉和脂质光谱区域的模型,用于玉米样品的来源分类。
6. 单步与两步地理模型比较
研究比较了单步国家分类模型和两步地理模型(先按大陆分类,再按国家分类)的分类效果。结果显示,两步模型在大陆级别的分类中表现优异,但在国家级别的分类中并未显著优于单步模型。
主要结果
1. 光谱解释与多元数据分析
光谱分析显示,玉米样品的光谱在蛋白质、淀粉和脂质相关的区域存在显著差异。PCA和PLS-DA分析进一步证实,样品可以根据其地理来源分为北美(美国)、南美(秘鲁)和欧洲(西班牙、乌克兰、斯洛伐克)三个主要组别。
2. 分类模型优化结果
最优的SVM模型在10次重复的10折交叉验证中达到了95%的平均准确率。其中,美国和秘鲁样品的分类准确率均为100%,而欧洲样品的分类准确率在96%至68%之间,斯洛伐克样品的分类效果较差。
3. 化学驱动波数选择结果
基于蛋白质、淀粉和脂质光谱区域的模型在全光谱模型的基础上表现相近,准确率为94.7%。这表明,特定化学物质的光谱区域在来源分类中具有重要作用。
4. 单步与两步模型比较结果
两步模型在大陆级别的分类中表现优异,所有样品均被正确分类。然而,在国家级别的分类中,两步模型的准确率为93.8%,略低于单步模型的95%。
结论
该研究首次证明了FT-NIR光谱结合SVM分类模型在玉米饲料来源验证中的潜力。研究开发了一种快速、低成本的筛查方法,能够在大陆和国家级别上对玉米样品进行准确分类。该方法在饲料真实性验证中具有重要的应用价值,特别是在全球贸易中用于追溯玉米的地理来源。
研究亮点
1. 重要发现
研究发现,FT-NIR光谱结合SVM模型能够以高准确率(95%)对玉米样品进行地理来源分类,特别是在大陆级别的分类中表现优异。
2. 方法创新
研究首次将FT-NIR光谱与化学计量学建模相结合,用于玉米饲料的来源验证,并提出了一种基于特定化学物质光谱区域的分类模型。
3. 研究对象的特殊性
研究涵盖了来自三个大陆、五个国家的101个玉米样品,样本来源广泛,具有较高的代表性。
其他有价值的内容
研究还探讨了不同预处理方法和核函数对分类模型性能的影响,为未来类似研究提供了重要的参考。此外,研究团队计划进一步验证模型的泛化能力,并扩展模型以涵盖更多的全球样品。