本文题为《A Survey of 2D Shape Representation: Methods, Evaluations, and Future Research Directions》,作者为 Laksono Kurnianggoro、Wahyono 和 Kang-Hyun Jo,分别来自 University of Ulsan 和 Universitas Gadjah Mada。该文章发布在 Neurocomputing 期刊 (Volume 300, 2018, Pages 1-16),准确的在线发布时间为 2018 年 3 月 10 日。
本综述集中讨论了基于图像的二维形状表示研究的相关方法和评价。近年来,二维形状分析在图像处理中被广泛研究,这是由于其在多个领域中的重要性和实用性,例如目标分类、形状检索等。这一研究领域经历了一系列发展:从早期的基于描述符的匹配方法到引入机器学习的高级形状分析方法。本文旨在总结这一领域的重要研究进展,对现有方法进行分类和评价,同时提出潜在未来研究方向。
研究背景中指出了形状分析在纹理感知与形状感知上的区别。相比于纹理特性,形状特性因其对传感器噪声的较高稳健性、更少受光照和颜色变化的影响而在某些应用中占据优势。因此,研究者们开发了多种形状表示方法,用以满足不同场景的需求。
文中首先回顾了几种经典的形状描述符及其特点。
瞬时量描述符 (Moment-based descriptors): Hu 矩(Moment Invariants) [1] 和 Zernike 矩 [26] 是最常见的瞬时量类型。其中,Hu 矩由于其对旋转、缩放和平移的不变性而广泛使用,而 Zernike 矩因其正交性具有更强的抗噪声能力及低冗余。
链码 (Chain Codes): 通过边界跟踪生成编码,用以表示封闭曲线形状的线段方向,支持 4-连通或 8-连通模式,具有简单易实现的优点,但对噪声较为敏感。
形状上下文 (Shape Context): 通过构建基于离散边界点分布的直方图来描述形状的局部特征,具有较强的抗噪声能力,但丢失了一些细节信息。
曲率尺度空间描述符 (Curvature Scale Space, CSS): 将复杂形状通过高斯平滑在不同尺度下简化,并记录点的曲率变化。该方法对旋转和噪声具有鲁棒性,且支持形状的多层级表征。
综述表明,以上描述符尽管年代较早,但依然被广泛应用于现代形状分析任务。
一种捕捉局部形状属性的常用方法是将形状空间划分为局部区域。目前普遍的分割方法包括:
主轴划分 (Principal Axis Partitioning): 以形状的主轴和次轴为依据,将形状划分为对称区块。此方法对旋转具有不变性。
最小惯性轴划分: 找到通过形状中心并使所有边界点的总距离最小的轴线,基于该轴线对区域等分。
边界分割 (Contour Partitioning): 通过均匀采样或离散边界演化(Discrete Contour Evolution)等策略将形状边界分割为小片段。
这些方法的主要作用是辅助生成更具辨识力的特征描述符。
随着机器学习的发展,其在形状分析中的应用不断扩展,尤其在分类与特征提取任务中表现出色:
支持向量机 (Support Vector Machine, SVM):在形状描述符的基础上,使用 SVM 对对象进行分类,能够在特征空间中构建鲁棒的决策边界。
深度学习 (Deep Learning): 深度学习尤其是卷积神经网络(Convolutional Neural Network,CNN)的引入,消除了繁琐的特征工程,通过自动特征学习实现了低维特征到分类的直接映射。文中提及多种网络架构(例如 LeNet 和 MNIST-CNN)的实验,证明了深度学习的强大能力。
同时,本研究还提到了基于机器学习的形状相似性度量学习方法。
本文总结了常用的评价指标和形状分析数据集:
评价指标:
常用数据集: 包括 MPEG-7、Swedish Leaf、ETH-80 等形状分析领域的标准数据集。以 MPEG-7 为例,研究着重分析了这一数据集中类别多样性及其挑战性。
形状分析具有广泛的应用,例如:
植物叶分类: 利用形状分析技术对不同植物的叶片进行分类,在农业与生物学研究中有重要应用。
人类行为监测: 对人体轮廓进行形状跟踪,如跌倒检测和步态识别,广泛用于医疗和监控。
交通辅助系统: 利用形状分析技术检测交通标志与行人行为,为自动驾驶与辅助驾驶系统提供技术支持。
字符识别: 在手写体与点阵字符的识别中,形状描述符如形状上下文被证明具有较高识别精度。
本文总结的研究不仅提供了二维形状分析方法的全景图,还指出了以下未来研究方向:
深度学习特征学习:应用深度学习自动捕捉形状特征,避免冗长的手工设计流程。
相似性度量学习:通过基于 Siamese 网络和 Triplet Loss 等方法,探讨形状检索中更加高效的相似性评估。
强化多尺度分析:结合传统描述符的优点,探索新的融合方式以提升效率和鲁棒性。
本文以详尽的方式汇总了二维形状分析领域的经典与新兴技术发展,为研究人员提供了系统的学习和参考资源。在未来,随着深度学习与高级数学模型的结合,形状分析领域将开辟更多创新应用领域并解决更复杂的实际问题。