本研究的主要作者包括:
- He, Zhuolin(复旦大学计算机科学学院)
- Li, Xinrun(博世公司研发部门)
- Tang, Jiacheng(复旦大学脑科学研究院)
- Qiu, Shoumeng(复旦大学计算机科学学院)
- Wang, Wenfu(博世公司研发部门)
- Xue, Xiangyang(复旦大学计算机科学学院)
- Pu, Jian(复旦大学脑科学研究院)
该研究于2024年10月24日提交,并发表在IEEE Transactions on Intelligent Transportation Systems期刊上。
本研究属于自动驾驶场景中的3D目标检测领域,特别是针对开放集(open-set)3D目标检测问题。传统的基于摄像头的3D目标检测器通常只能识别预定义的目标类别,而在现实世界中,自动驾驶系统可能会遇到未见过的新目标,这带来了安全隐患。
现有的3D目标检测器在封闭集(closed-set)场景下表现良好,但在开放集场景中,由于无法检测到未知目标,可能导致自动驾驶系统出现错误行为,甚至引发严重事故。因此,开发一种能够在开放集场景中检测未知目标的3D目标检测器具有重要的现实意义。
本研究旨在提出一种新的两阶段训练框架OS-Det3D,通过结合摄像头和激光雷达(LiDAR)数据,提升摄像头3D检测器在开放集场景中的检测能力,使其不仅能够识别已知目标,还能检测到未知目标。
研究在NuScenes和KITTI数据集上进行了广泛的实验,验证了OS-Det3D的有效性。实验结果表明: - 未知目标检测:OS-Det3D在KITTI数据集上的未知目标召回率(recall)和平均精度(AP)显著优于现有的开放集3D检测方法。 - 已知目标检测:OS-Det3D不仅提升了未知目标的检测能力,还提高了已知目标的检测性能。
本研究提出了一种创新的两阶段训练框架OS-Det3D,首次实现了基于摄像头的开放集3D目标检测。通过结合LiDAR的几何信息和摄像头的视觉特征,OS-Det3D能够在开放集场景中检测到未知目标,填补了现有3D目标检测器的空白。
OS-Det3D的应用将显著提升自动驾驶系统的安全性,使其能够在复杂的现实环境中更好地应对未知目标,减少事故发生的可能性。此外,该框架还为未来的开放集3D目标检测研究提供了新的思路和方法。
本研究通过提出OS-Det3D框架,成功解决了自动驾驶场景中的开放集3D目标检测问题。该研究不仅在理论上具有创新性,还在实际应用中具有重要的安全价值,为未来的自动驾驶技术发展提供了新的方向。