场景图像不变特征提取及分类方法的研究

来源 :北京邮电大学 | 被引量 : 7次 | 上传用户：pwf890617

【摘要】

：

图像分类是计算机视觉领域的一个基本问题,近年来已吸引了大量的关注。目前的研究往往以结合空间金字塔匹配(Spatial Pyramid Matching,SPM)的词袋(Bag-of-Words, BoW)模型为

【作者】

：

李群

【出处】

：

北京邮电大学

【发表日期】

：

2013年01期

【关键词】

：

场景图像分类特征提取词激活力倒排文档频率词袋参考比较

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像分类是计算机视觉领域的一个基本问题,近年来已吸引了大量的关注。目前的研究往往以结合空间金字塔匹配(Spatial Pyramid Matching,SPM)的词袋(Bag-of-Words, BoW)模型为基础展开。此方案为场景图像分类提供了一个有效的捕捉图像统计信息的方式。词袋模型最初应用于自然语言处理和信息检索,是一个简化的假设。在这个模型中,不考虑语法甚至语序,把文本(如一个句子或者一个文档)表示为一个无序的词的集合。计算机视觉的研究者们从此受到启发,把该理论扩展应用到图像表示中。假定图像是一个文本,从图像提取的局部关键点特征对应于文本中的“词”。BoW表示是进一步图像处理的基础,如目标识别。此方法首先学习一个视觉词汇表(vocabulary),然后量化每一个图像的关键点特征使其成为视觉词汇表中的的某个视觉词(visual word),最后用视觉词的频率直方图表示图像。视觉词汇表也称为码书或者码本(codebook),视觉词汇相对应的称为码字(codeword)。在此过程中,往往用聚类算法(k-means)生成码书。大量的研究和学习表明,BoW模型在目标识别领域取得了令人鼓舞的成果。因此,本文以BoW模型为研究背景,主要探讨和研究图像不变特征的表示方法和场景图像分类算法。目前,码书通常是用训练集图像通过聚类方法得到。此外还有基于有监督的码书学习、核码书学习、稀疏编码等码书生成方法。利用这些方法生成的码书存在冗余的缺点。本文中,应用新近提出的激活力(Word Activation Forces, WAFs)来减少BoW模型中码书的冗余性。实验结果表明,基于WAFs的码书优化算法是有效的。通过码书的优化,图像特征表示得到改善。此外,本文提出使用软阈值-倒排文档频率(soft-Inverse DocumentFrequency,soft-IDF)优化BoW特征。给定码书和数据集,每个视觉词(码字)在特定的图像中出现的次数不同,而且出现在不同数量的图像中。一些视觉词出现频率很高,相反一些视觉词罕见的出现在几幅图像中。基于Soft-IDF的BoW特征优化方法平衡了这种不均衡性。实验表明,所提出的方法在场景图像分类中取得了令人鼓舞的效果。本文还提出基于参考比较(reference-based)的场景图像分类方法。该方法用一个参考集(reference-set)对图像进行表示,并利用该reference-set进行码书学习。联合reference-set的码书学习过程为：首先加权联合该reference-set到目标函数中,形成一个归一化的目标函数,然后用K-SVD算法优化求解,学习码书。码书生成以后,提取图像的局部限制的线性编码特征(Locality-constrained Linear Coding, LLC)表示图像。接下来,计算图像和reference-set的相似度矢量,以此矢量作为图像的最终特征。通过此过程,图像的特征空间维数显著降低。更重要的是,实验结果表明,reference-based算法实现了卓越的分类性能。Reference-based场景图像分类算法成功引入一个reference-set到码书学习和图像特征表示过程,其reference-set是每类图像中随机选取若干图像组建而成,相似度度量方法也是应用简单的距离测量。本文中,作者对该算法主要从两方面进行了改进。首先,给定更有代表性的reference-set。为此,本文改进了k-means聚类方法,在特征空间选择了一个更有代表性的reference-set。另一方面,在图像分类过程中,把reference-set的每一类看作一个社会网络,用社会网络中的中介度中心性(betweenness centrality)度量图像和reference-set的相似性。因为考虑了查询图和reference-set的整体关联性,因此该度量方法更加准确。而且不同于以往只考虑图像与图像的相似度测量,betweenness centrality引入了图像到图像类的相似度测量。通过大量的实验证实,改进算法获得了更好的性能,改进算法也成功的将社会网络的理论应用到场景图像分类领域。

其他文献

福建省广电统一经营LED综合信息业务平台的设想

2008年北京奥运会、2010年上海世博会上,LED显示屏以其巨大的视觉冲击力创造了震撼世界的场景,引发了近年来城市户外广告业呈井喷态势。LED屏幕广告兼备动态影像与信息滚动传

期刊

LED全彩显示屏广告传媒城市户外广告综合信息业务平台

模糊控制算法在非晶合金铁心热处理工艺中的应用

非晶合金变压器铁心进行热处理的目的在于消除带材在高速冷却过程中和铁心在剪切、成型过程中产生的应力。应力越大,铁心的损耗越大和所需激磁功率也越大。文中研究分析了不

期刊

非晶合金铁心热处理工艺模糊算法

浅谈基于信息技术环境下的中职英语教与学

在大数据时代,以云计算为重要标志的信息技术突飞猛进,继续为推动我国科技进步和社会发展服务。信息技术不只位继续发挥剧烈的余热。本文以中职英语的教学实际为切入点,系统

期刊

中职英语信息技术多媒体教与学

基于城市管理专业Auto CAD软件课程的教学改革

鉴于目前Auto CAD软件课程教学中普遍存在的目标导向性弱、教学课时紧、教学内容较多、学习效果不理想等问题,从教学内容、教学方法、教学模块、考核方式等方面进行了教学改革,从而将理论与实践相结合,不仅能够圆满地完成教学任务,而且培养了学生的综合应用能力和自主创新能力。

期刊

CAD教学协同教学教学改革CAD teachingcollaborative teachingteaching reform

推进专科层次全科医学教育改革培养实用型人才

研究基层群众对医疗服务的需求，分析目前专科层次全科医学教育现状，提出和探索适应基层医疗服务所需的专科层次全科医学教育改革思路，通过市场分析、优化课程设置、提高师资水平

期刊

专科层次全科医学基层卫生人才

信息化和智能化应用于啤酒包装的效益分析、未来趋势展望

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

信息化智能化啤酒包装工业4.0

过载继电器智能保护技术

期刊

过载保护继电器智能保护微处理器选取隔离技术接地技术

清末民初西方“个人”概念的引入与置换

戊戌维新后到新文化运动发生这一段时间，中西文化全面接触、交流、融合，西方“个人”话语以及西方现代个人观念的一些基本要素或理念先后被引入中国。但在当时的思想文化界，对民

期刊

个人国民现代个人观念

国外人均城市建设用地标准研究

长期以来,人均城市用地研究始终受到学者和规划部门的广泛重视,因为城市人均用地标准是城市规划和土地利用规划的重要依据,是预测未来城市用地需求的基础参数。相关研究表明,

会议

人均城市建设用地城市人口城市建设用地国际经验借鉴

当前宏观经济形势对铝价及再生铝行业的影响

日前公布的数据显示中国8月经济数据依旧不佳,中国经济尚未呈现企稳迹象。美联储9月议息会议纪要宣布9月暂不加息,亦考虑了以中国为代表的非美国家经济不佳时期加息的风险。

期刊

再生铝同比增长宏观经济形势美联储

场景图像不变特征提取及分类方法的研究

其他学术论文