本研究由蔡国成在西安电子科技大学光电工程学院完成,导师为宫睿副教授和李江勇研究员。该研究作为硕士学位论文,于2023年6月提交。
随着数字化技术的快速发展,许多领域对信息维度的需求日益增加,尤其是在三维模型获取方面。三维重建技术作为将二维图像转换为三维模型的关键技术,广泛应用于增强现实(AR)、自动驾驶、医疗等领域。偏振三维成像技术通过分析物体表面出射光波的偏振特性,利用其与物体表面三维形状的映射关系,恢复出物体的三维模型。该技术因其高精度、低设备复杂度和高性价比的优势,受到了广泛关注。然而,偏振三维成像技术在场景级目标应用中仍存在关键技术问题,特别是在光照不均和复杂材质环境下,偏振法线梯度的准确性和三维信息的获取面临挑战。
本研究旨在解决室内场景偏振三维成像中由于光照不均和复杂材质导致的偏振法线梯度不准确和三维信息获取困难的问题,提出了一种基于深度估计的室内场景偏振三维成像方法,能够在获取室内场景真实三维形状的同时保留丰富的纹理细节信息。
本研究主要包括以下步骤:
偏振法线梯度校正:针对偏振固有的方位角模糊性问题以及室内场景中复杂环境光导致的光强校正偏振方法失效的问题,采用结合卷积神经网络(CNN)的场景表面法线梯度校正方法。研究设计了一个基于深度学习的场景深度估计网络结构,包括编码器、解码器和损失函数的设计,并引入CoordConv模块以改善观测方向对场景级目标偏振信息获取的影响。
偏振三维重建实验:在四个具有不同光照、色彩、材质和目标个数的场景中进行了偏振三维重建实验。实验过程中获取并分析了偏振子图像、偏振度图像、偏振角图像和天顶角图像,利用神经网络估计的场景深度对偏振法线梯度进行校正,最终通过基于梯度的积分算法进行三维重建。
实验结果表明,本研究提出的基于深度估计的室内场景偏振三维成像方法能够有效解决偏振固有的方位角模糊性问题,并在光照不均的室内场景中采用更具适用性的深度估计法线梯度校正方法,改善了观测方向对场景级目标偏振信息获取的影响。该方法在获取场景真实三维信息的同时,保留了丰富的纹理细节信息。
本研究为高精度和纹理丰富的室内场景偏振三维成像技术提供了理论方法和实施方案,具有重要的科学价值和应用前景。通过结合深度学习技术,本研究不仅解决了传统偏振三维成像方法中的关键技术问题,还为场景级目标的偏振三维重建提供了新的思路。
尽管本研究在室内场景偏振三维成像方面取得了显著进展,但仍有一些问题需要进一步研究。例如,如何在更复杂的光照条件下进一步提高重建精度,以及如何将该方法应用于更大规模的场景重建中。未来的研究可以进一步优化深度学习模型,探索更多场景下的应用潜力。
这篇报告详细介绍了研究的背景、方法、结果和意义,旨在为相关领域的研究者提供全面的参考。