分享自:

基于优化YOLO模型的水产养殖池塘鱼类检测研究

期刊:Scientific ReportsDOI:10.1038/s41598-025-89611-y

类型a:这篇文档报告了一项原创研究,因此应按照类型a的要求生成学术报告。


主要作者与机构及发表信息
本文由M. Vijayalakshmi和A. Sasithradevi撰写,分别隶属于印度Vellore Institute of Technology的电子工程学院和高级数据科学中心。该研究于2025年发表在《Scientific Reports》期刊上。

学术背景
水产养殖在全球粮食安全、经济发展和自然资源保护中发挥着重要作用。然而,传统的监测方法耗时且劳动密集,难以满足日益增长的生产需求。近年来,计算机视觉技术因其高效性和实时性逐渐被应用于水产养殖环境监测中。鱼类检测是基于视觉系统的监测中的关键步骤,但其面临诸多挑战,如光照变化、水体浑浊度差异、植被覆盖以及动态背景等。为了解决这些问题,本研究提出了一种新的模型——AquaYOLO(Advanced YOLO-based Fish Detection for Optimized Aquaculture Pond Monitoring)。该模型旨在优化鱼类检测性能,特别是在南印度池塘环境中,从而支持小规模水产养殖的可持续发展。

研究流程
本研究的工作流程包括以下几个主要部分:

  1. 数据集构建与处理
    研究团队收集了来自南印度泰米尔纳德邦多个水产养殖场的实时视频,并从中提取了关键帧以构建DePondFI(Detection of Pond Fish)数据集。该数据集包含8150张图像和约50,000个边界框标注,涵盖了多种鱼类(如鲤鱼、罗非鱼、鲶鱼等)和不同水质条件下的场景。图像经过预处理后统一调整为640×640像素大小,并使用Roboflow软件进行边界框标注。

  2. 模型设计与架构
    AquaYOLO模型的设计基于YOLO(You Only Look Once)框架,但对其进行了多项改进以适应复杂的水下环境。模型架构分为三个主要部分:

    • Backbone(特征提取):采用CSPDarkNet53作为主干网络,结合CSP(Cross-Stage Partial)层和增强型卷积操作,以提取分层特征。通过SPPF(Spatial Pyramid Pooling Fast)模块捕获多尺度特征。
    • Head(多尺度特征聚合):通过上采样、拼接和多尺度融合操作整合不同分辨率的特征图,提升特征表示能力。
    • Detect(检测头):利用精确的40×40尺度进行边界框回归,并移除最终的C2F层以确保定位准确性。
  3. 实验设置与训练过程
    模型训练在Google Colab Pro平台上完成,使用Tesla 4 GPU和25 GB RAM资源。训练数据按70%、20%和10%的比例划分为训练集、验证集和测试集。训练过程中采用了以下参数:

    • 学习率初始值和最终值均为0.01;
    • 批量大小为64;
    • 使用SGD(Stochastic Gradient Descent)优化器,动量为0.95,权重衰减为0.0001;
    • 训练周期为25个epoch,前10个epoch进行warm-up。
      此外,还对三种变体模型(AquaYOLO#1、AquaYOLO#2、AquaYOLO#3)进行了超参数调优,以选择最佳模型。
  4. 评估与对比
    模型性能在DePondFI数据集上进行了全面评估,并与当前最先进的目标检测模型(如Faster R-CNN、EfficientDet、YOLOv5等)进行了对比。此外,还对DeepFish和OzFish两个公开基准数据集进行了跨数据集评估,以验证模型的泛化能力。

主要结果
1. DePondFI数据集上的表现
AquaYOLO在DePondFI数据集上表现出色,达到了0.889的精确率(Precision)、0.848的召回率(Recall)以及0.909的mAP@50(Mean Average Precision at IoU threshold 0.5)。与其他变体模型相比,AquaYOLO在检测精度和计算效率方面均具有显著优势。例如,AquaYOLO仅需1.38小时完成训练,且预处理和后处理时间分别为0.1 ms和1.1 ms。

  1. 跨数据集评估结果
    在DeepFish和OzFish数据集上的评估显示,AquaYOLO在复杂水下环境中的检测能力尤为突出。在合并后的DeepFish+OzFish数据集上,模型的mAP@50达到0.814,表明其具有较强的泛化能力。定性分析进一步证实,AquaYOLO在处理重叠对象、低可见度和不均匀光照条件下表现优异。

  2. 与现有模型的对比
    与现有模型(如YOLOFish和Detectron)相比,AquaYOLO在mAP(0.52 vs. 0.1569和0.389)和处理速度(0.0001秒 vs. 0.87秒和0.036秒)方面均占据明显优势。这表明AquaYOLO能够有效应对DePondFI数据集中的复杂场景。

结论与意义
AquaYOLO的成功开发标志着水产养殖监测领域的重要进步。该模型不仅在检测精度和运行效率上优于现有方法,还为实时监测提供了经济高效的解决方案。其科学价值体现在以下几个方面:
1. 提高了复杂水下环境中鱼类检测的准确性和鲁棒性;
2. 支持鱼类计数、物种识别和生物量估算等关键水产养殖过程;
3. 可与先进传感器集成,实现水质监测和环境变化检测,从而优化鱼类健康条件。

应用价值方面,AquaYOLO有助于推动南印度地区的小规模水产养殖向智能化和可持续化方向发展。此外,该模型还可为全球其他地区的水产养殖监测提供参考。

研究亮点
1. 创新性模型设计:通过引入CSP层、SPPF模块和优化的C2F层,AquaYOLO显著提升了特征提取和检测能力。
2. 高效性与泛化能力:模型在多个数据集上的表现证明了其强大的泛化能力和适应性。
3. 实际应用潜力:AquaYOLO可直接应用于南印度池塘环境的实时监测,为当地水产养殖业带来显著经济效益。

其他有价值内容
研究还指出了当前模型的局限性,如对小型或远距离鱼类的检测能力仍有待提高,尤其是在极端浑浊或遮挡严重的场景中。未来工作将集中在改进遮挡处理、提升小目标检测能力以及优化低可见度条件下的性能等方面。这些努力将进一步增强AquaYOLO在多样化水产养殖场景中的适用性。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com