基于内容的图像检索中综合特征提取及特征融合技术的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:nxjmbxy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着互联网、移动互联网及相关技术的飞速发展,数字图像的数量呈现爆炸式增长,从一堆图像中检索出目标图像的需求也变得愈加迫切。图像数量的剧增造成最直接的影响就是图像检索的任务变得艰巨。因此,如何快速准确的从图像数据库中检索出目标图像成为研究热点。最早的图像检索系统是基于关键词的检索,通过用户输入的关键词与图像的上下文(例如标题、人工标注)进行匹配。这些系统普遍存在文本信息缺少、图像和文本的含义不一致等问题。为了解决这几个难题,基于内容的图像检索系统被提出。CBIR(Content-Based Image Retrieval)可以自动从图像中提取底层特征(例如颜色、纹理、形状等)。此外在计算机视觉、模式识别和数据挖掘等领域,研究人员经常会遇到高维的特征向量,它们中间存在着很多相互关联或冗余的信息,甚至还有噪声。这些数据不仅明显提高了时间和空间方面的处理要求,还可能产生拟合过度、效率低和性能差等学习任务的副作用。实际上只有部分特征维度是重要的、有辨识度的。特征选择技术就是一种解决上述问题的方法,根据一定的评价标准选择最相关的特征子集,不仅降低了特征维度,而且提高了特征的辨识度。针对上述问题,本文重点研究了基于内容的图像检索中的综合特征提取、特征融合以及用户相关性反馈的技术。在特征提取方面,我们通过改进得到了一种性能更优的特征提取算法CoCD(Contrast and Color Distribution)。原有的特征提取算法CoLD(Contrast and Luminance Distribution)主要描述了图像的纹理特征与亮度特征。为了获取图像中更多的有效信息,我们引入在HSV颜色空间的颜色分布来代替原有的亮度分布,研究了对比度分布和颜色分布的重要度,调整了二者在相似性度量过程中的权重。实验结果说明通过统计抽样来提取特征是有效的。在此基础上我们提出了一种新的基于统计抽样的特征提取算法:分块均方算法BMVA(Blocked Mean-Variance Algorithm)。用户反馈技术是CBIR系统中常用的一种用于提高系统检索性能的交互技术。根据信息传递过程中能量衰减的思想,我们提出了一种新的用户反馈技术并应用到图像检索系统中,提高了系统的检索性能。特征融合方面,结合特征选择以及信息融合的思想,我们提出了一种基于图论的非监督式特征融合算法UGFF(Unsupervised Graphtheory-based Feature Fusion),该算法可以综合多种特征提取算法,降低特征维度之间的信息冗余,抽取出一个低维的、更高辨识度的特征。以开放的Corel5K(5000幅)和Wang1K(1000幅)作为测试的图像数据库,欧氏距离、余弦距离以及有效地流排序算法EMR(Efficient Manifold Ranking)作为相似性度量和排序方法,平均查准率MAP(Mean Average Precision)作为评价标准,我们验证了本文提出的两种特征提取算法、一种相关性反馈技术以及一种基于图论的非监督式特征融合算法的性能。实验结果显示,我们提出的两种新的特征提取算法能够达到较好的检索性能,相关性反馈算法能够明显提高检索性能,基于图论的非监督式特征融合技术不仅降低了特征向量的维度而且提高了特征向量在检索系统中的辨识度。
其他文献
发布/订阅(Publish/Subscribe,P/S)通信范型具有异步、多点通信等优点,一直受到学术界和工业界的普遍关注。传统有线网络中的发布/订阅系统的研究相对比较成熟,在金融、物流
Web服务作为一种新的计算模型正受到越来越多的关注,保证Web服务组合执行结果的一致性和可靠性是Web服务面临的重要挑战之一。将事务机制应用到Web服务领域是寻求解决Web服务
长期以来图像显著性研究都是人类视觉研究的一个重要组成部分,对于它的研究存在于神经科学、心理学、计算机科学等学科的交叉领域。 在计算机科学的研究领域里,模拟人眼的认
随着越来越多的网络经济活动的开展,网络安全受到更多的关注,入侵检测作为一种主动有效的防御手段得到越来越多的重视和研究。入侵检测方法结合一些智能技术应用到入侵检测系
随着我国国民经济的发展,机动车保有量不断增加,机动车数量的增加也使得道路交通安全形势严峻,交通事故持续增长。为提高道路交通安全性,减少和预防交通事故,人-车-路环境协
数字动漫与影视产业是信息技术和人文艺术结合的内容创意产业,目前在世界各国均占有很大的市场规模。计算机3D技术在影视动漫作品的创作与制作中发挥着越来越重要的作用,3D建
植物是人类生活中重要的资源,近年来,随着计算机模式识别和人工智能技术的不断发展,使用计算机视觉和数字图像处理手段对植物进行分割、分类、识别的研究逐渐成为研究的热点
随着信息化的不断推进,许多高等级医院已经开始构建或使用电子病历系统来记录病人的医疗情况。由于电子病历不仅具有法律效力,而且还涉及到用户的隐私,因此必须对病历数据进
图形是传递信息最主要的媒体之一,计算机图形学的发展和应用在某种意义上已成为计算机软、硬件发展水平的标志,是信息技术中不可缺少的重要内容和发展基石。计算机图形绘制技
近些年来,随着计算机图形学的发展,动漫、影视、广告宣传等领域越来越重视渲染结果的逼真程度,如何获得极尽真实的渲染效果已经成为计算机真实感图形学的主要研究目标。材质