基于内容的形状检索研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:xiaozhui221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二维形状的描述与匹配是一直是众多计算机视觉和模式识别领域学者研究的热点,在图像检索、医学影像、产品识别等多个工业领域和科学研究领域都广泛应用。其主要思路是利用计算机模拟人眼的视网膜感知物体的生理过程,从事物的整体或局部提取二值图像相关特征,利用一些经典的模式识别算法将其转化为易于比较的表达形式,并在各图像数据集中进行检索识别,最后依次返回与检索图像相似度较高的图像。本文的工作主要基于形状描述和分析方法,在已有的形状检索算法的基础上,分别从算法检索精度和形状匹配速度两个角度提出了改进算法,而且融入了其他经典方法论,并成功应用于形状检索和匹配。本文的主要内容和贡献如下:(1)通过基于轮廓和基于区域两大类介绍了形状检索发展至今一些经典的形状紧凑型描述和分析方法,详细地阐述了这些算法本质思想和实现过程,比较了它们的优缺点,分析了可以改进的大致方向。(2)针对轮廓点分布直方图(Contour Points Distribution Historgram,CPDH)形状描述子和内距离形状上下文(Inner-distance shape context,IDSC)形状描述子算法复杂度较高,形状检索过慢的缺点。提出利用EMD-1算法计算二维直方图之间相似度,EMD-1算法本质思想是基于EMD(Earth Mover’s Distance)融入1范数,采用流的方式计算地面距离矩阵。而IDSC中二维直方图之间最优匹配的问题也可以用EMD-1相似度度量算法进行求解。多个数据集的实验结果表明,改进算法不仅有效地提升了形状的检索和匹配速度而且保持了描述符良好的尺度缩放和平移不变性。(3)轮廓点分布直方图CPDH是一种优秀的二维形状描述子,但是其在大数据中检索效果不佳。针对这一缺点,提出了一种基于协同传递机制的形状匹配算法。该算法基本思想是基于半监督学习中的标签传播算法(Labe propagation,LP)搭建一个标签传递框架Co-transduction。通过输入两种不同检索算法的形状相似度矩阵,并赋予查询形状一个标签信息,在两个相似度矩阵进行迭代检索和标签传播,最后返回与其最相似的形状。在大形状数据集中该改进算法的检索性能明显优于CPDH算法。(4)针对CPDH之间相似度计算问题,提出了一种基于形状轮廓特征的金字塔匹配算法。不同于其他传统的直方图度量算法,金字塔匹配算法将形状的轮廓分成若干块,并且给每一块分配相应的权重,然后分别统计块中的特征并计算特征的加权和。最后计算二维直方图之间的距离。该算法易实现,复杂度低,而且通过在不同形状数据集中的实验分析,该算法能够有效地进行形状匹配和检索,且有较好的形状检索性能。(5)CPDH是一种基于统计思想的形状描述符,但是其缺少必要的鉴别信息。在CPDH的基础上引入线性鉴别分析(Linear Discriminant Analysis,LDA)和核鉴别分析(Kernel Discriminant Analysis,KDA)方法,提出了DCPDH算法。各通用数据集的实验结果表明,DCPDH算法在大数据集中的识别正确率明显优于CPDH算法,运算速度也得到了明显地提升,而且保持了形状对仿射变换良好的鲁棒性。
其他文献
随着新兴的网络视频相关服务和设备的兴起,例如视频共享、视频广播、广告和视频推荐等,网络视频的数量急剧增长。越来越多的用户参与到视频相关的活动中,包括上传和下载视频,
随着信息技术的高速发展,图像作为一种描述目标物体十分形象有力的表达方式,慢慢变成从业者获取信息、分析信息和利用信息的重要手段。经过这些年的发展,深度学习方法取得了
通常信号的相位和振幅信息是研究人员判断正确信号的重要依据,但在衍射成像等领域下,一般光学监测设备仅能测得图像的傅里叶变换的振幅信息,往往还被噪声所污染,这就影响了研
近几十年来,网络控制系统(NCSs)在控制和通信科学领域受到了广泛的关注和重视。所谓网络控制系统,即系统装置信息和控制器信号通过数字化、智能化的网络通信通道进行传输的闭
面对新一代移动互联网的浪潮,电信运营商的竞争和挑战前所未有。提供客户的新服务竞争力将成为运营商生存的关键。电信客服平台作为海量的客户接触部门,其海量的数据中蕴藏着
在生物学领域,识别microRNA(miRNA)与疾病之间的关联性对于临床医疗具有极其重要的意义,因此构建miRNA与疾病关联网络受到生物科学界越来越大的关注.然而,现今在这方面的研究
随着大数据时代的到来,每天产生大量的图片和视频数据,计算机视觉作为对图片进行处理的计算机技术,越来越多的被应用到日常生活中来,如目标识别,目标检测,语义分割和目标追踪
近些年,随着互联网技术的迅猛发展,一大批社区问答网站开始涌现,比如Yahoo!Answers、Stack Overflow以及Quora等。用户可以在这些网站上自由地提问,也可以回答其他人所提出的
数字图像能够为我们提供直观、生动以及形象的信息,使得其在数字信息表达中扮演了一个最要的角色,并得到了广泛的应用。正因为如此,数字图像的安全问题成为了国内外学者不断
真实感渲染效果一直是计算机图形学核心内容之一,主要用于虚拟现实、影视特效、图形仿真模拟、游戏等方面。如何实现照片级的渲染效果是近年来研究的热点方向。材质的表面各