论文部分内容阅读
二维形状的描述与匹配是一直是众多计算机视觉和模式识别领域学者研究的热点,在图像检索、医学影像、产品识别等多个工业领域和科学研究领域都广泛应用。其主要思路是利用计算机模拟人眼的视网膜感知物体的生理过程,从事物的整体或局部提取二值图像相关特征,利用一些经典的模式识别算法将其转化为易于比较的表达形式,并在各图像数据集中进行检索识别,最后依次返回与检索图像相似度较高的图像。本文的工作主要基于形状描述和分析方法,在已有的形状检索算法的基础上,分别从算法检索精度和形状匹配速度两个角度提出了改进算法,而且融入了其他经典方法论,并成功应用于形状检索和匹配。本文的主要内容和贡献如下:(1)通过基于轮廓和基于区域两大类介绍了形状检索发展至今一些经典的形状紧凑型描述和分析方法,详细地阐述了这些算法本质思想和实现过程,比较了它们的优缺点,分析了可以改进的大致方向。(2)针对轮廓点分布直方图(Contour Points Distribution Historgram,CPDH)形状描述子和内距离形状上下文(Inner-distance shape context,IDSC)形状描述子算法复杂度较高,形状检索过慢的缺点。提出利用EMD-1算法计算二维直方图之间相似度,EMD-1算法本质思想是基于EMD(Earth Mover’s Distance)融入1范数,采用流的方式计算地面距离矩阵。而IDSC中二维直方图之间最优匹配的问题也可以用EMD-1相似度度量算法进行求解。多个数据集的实验结果表明,改进算法不仅有效地提升了形状的检索和匹配速度而且保持了描述符良好的尺度缩放和平移不变性。(3)轮廓点分布直方图CPDH是一种优秀的二维形状描述子,但是其在大数据中检索效果不佳。针对这一缺点,提出了一种基于协同传递机制的形状匹配算法。该算法基本思想是基于半监督学习中的标签传播算法(Labe propagation,LP)搭建一个标签传递框架Co-transduction。通过输入两种不同检索算法的形状相似度矩阵,并赋予查询形状一个标签信息,在两个相似度矩阵进行迭代检索和标签传播,最后返回与其最相似的形状。在大形状数据集中该改进算法的检索性能明显优于CPDH算法。(4)针对CPDH之间相似度计算问题,提出了一种基于形状轮廓特征的金字塔匹配算法。不同于其他传统的直方图度量算法,金字塔匹配算法将形状的轮廓分成若干块,并且给每一块分配相应的权重,然后分别统计块中的特征并计算特征的加权和。最后计算二维直方图之间的距离。该算法易实现,复杂度低,而且通过在不同形状数据集中的实验分析,该算法能够有效地进行形状匹配和检索,且有较好的形状检索性能。(5)CPDH是一种基于统计思想的形状描述符,但是其缺少必要的鉴别信息。在CPDH的基础上引入线性鉴别分析(Linear Discriminant Analysis,LDA)和核鉴别分析(Kernel Discriminant Analysis,KDA)方法,提出了DCPDH算法。各通用数据集的实验结果表明,DCPDH算法在大数据集中的识别正确率明显优于CPDH算法,运算速度也得到了明显地提升,而且保持了形状对仿射变换良好的鲁棒性。