基于高阶几何结构建模的点云无监督域适应
基于高阶几何结构建模的点云无监督领域适配
研究背景及动因
点云数据是一种描述三维空间的关键数据形式,广泛应用于自动驾驶、遥感等现实场景中。点云可以捕获精确的几何信息,但在跨设备或跨场景应用时,采集点云的几何特性可能会由于传感器噪声、采样方式及环境影响而发生显著改变。这种显著的几何变化(即领域间差距,domain gap),导致了在一个领域进行训练的神经网络难以在其他领域上保持性能。这一问题限制了点云深度学习方法在实际应用中的推广。
目前,无监督领域适配(Unsupervised Domain Adaptation, UDA)为解决这一问题提供了一种有效途径。其核心目标是将源领域(有标签数据)的知识迁移至目标领域(无标签数据),通过学习共享结果的跨域特征表征来缩小领域间差距。然而,已有方法主要聚焦于点云的低阶几何形状特征,而未充分利用高阶几何结构特征(如法向量和曲率)。对此,本文提出了一种新的无监督领域适配框架HO-GSM,首次对高阶几何结构进行建模,旨在进一步丰富模型的几何特征获取能力并提升领域对齐的质量。
论文来源及作者信息
本文题为《Unsupervised Domain Adaptation on Point Clouds via High-Order Geometric Structure Modeling》,由Jiang-Xing Cheng、Huibin Lin、Chun-Yang Zhang与C.L. Philip Chen(IEEE会士)发表于 IEEE Transactions on Artificial Intelligence (Volume 5, No. 12, December 2024)。作者分别来自福州大学计算机与数据科学学院(Fuzhou University)及华南理工大学计算机科学与工程学院(South China University of Technology)。论文于2024年10月18日在线发表,并得到了中国国家自然科学基金(Grant 62476059)的资助支持。
研究方法与工作流程
为了解决点云跨领域适配问题,HO-GSM框架结合了多种自监督任务和对比学习方法,分为以下几大模块:
1. 高阶几何结构特征建模(HO-GFL)
模型的创新核心在于引入了一种高阶几何结构特征的自监督学习任务。其方法如下: - 特征提取:基于PCA(主成分分析)对点云的局部邻域进行平面拟合,计算高阶特征如法向量(Normal)和曲率(Curvature)。法向量反映点云表面的局部连接性,而曲率度量局部平面的曲面弯曲及形状变化程度。高阶特征的提取过程无需额外分类标签。 - 不变性编码:通过旋转增强操作,获取经过旋转后的点云高阶几何结构特征,并设计基于均方误差的损失函数,学习高阶几何特征的增广不变性。
2. 低阶几何形状特征学习(LO-GFL)
通过构造两个自监督任务对低阶全局/局部几何特征进行编码: - 全局旋转角度预测:随机旋转点云后预测旋转角度,以学习点云的全局形状特征。 - 局部区域变形重建:模拟扫描过程中的局部点云丢失情况,通过点云局部的体素采样与重建增强模型的鲁棒性。
3. 语义特征学习(SFL)
由于目标领域没有标签,模型通过伪标签(Pseudo-labels)与自步进自训练方法挖掘目标领域的数据分布。伪标签生成通过逐步增加置信度阈值,确保学习更丰富的语义特征。
4. 对比学习模块(CONL)
虽然多领域对齐已缩小了领域间特征分布的差距,但要实现更高质量的分类,仍需确保跨领域类级别的特征区分性。HO-GSM基于监督对比学习(Supervised Contrastive Learning),借助伪标签扩充正负样本对,从而增强目标领域特征的辨别性。
最终,整体损失函数综合考虑了上述任务模块的贡献,确保网络在多维约束下进行优化。
实验结果
为了验证HO-GSM的有效性,论文在两个基准数据集上进行测试:
1. 数据集
- PointDA-10:包含3个领域(Shapenet、Modelnet、Scannet),涵盖10个共享类(如“桌子”、“椅子”)。该数据集设计了多种适配场景,包括Synthetic-to-Real(合成到真实)及Real-to-Synthetic(真实到合成)。
- GraspNetPC-10:包含3个领域(Kin、Realsense、Synthetic),模拟点云噪声及几何失真等真实场景。
2. 主流对比方法
论文与包括PointDAN、GAST、ImplicitPCDA在内的多个领域适配技术进行了详细对比。
3. 效果表现
- 综合优势:HO-GSM在PointDA-10和GraspNetPC-10上的平均分类精度分别达到77.1%和89.2%,相比当前最优方法分别提升了2.0%和4.8%。
- 类级别性能提升:通过T-SNE可视化,HO-GSM提取的目标领域特征更紧凑,尤其在易混淆类别(如“椅子”和“柜子”)上表现出更好的区分。
- 模块重要性分析:高阶几何结构特征学习(HO-GFL)和对比学习模块(CONL)均显著提升了性能。
意义与贡献
创新性:
- 首次在点云无监督领域适配中建模高阶几何结构特征。
- 设计增广不变性编码增强模型鲁棒性。
科学与应用价值:
- 提高了点云神经网络在跨领域任务中的性能,特别是在复杂现实场景下的适配能力。
- 可广泛用于自动驾驶、3D视觉等领域。
前景与挑战:
- 模型涉及多个自监督任务,使得框架较为复杂。未来简化框架、探索更高效的点云领域泛化(Domain Generalization)将是重要研究方向。
总结
HO-GSM 提供了一种面向高阶几何结构特征的点云领域适配新路径,为提升点云模型的跨领域能力设立了新的基准。它不仅克服了现有方法的不足,还为点云几何特征分析提供了更多的研究可能性。