基于视觉显著性的图像识别的研究

被引量 : 0次 | 上传用户:hastenhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展和信息的日益丰富,机器视觉受到了广泛的重视。如何应用计算机模仿人类处理图像的机制来快速而准确地将海量图片进行识别和分类,需要同时结合计算机科学、生物物理学以及心理学的研究。通常,这类研究会结合基于人眼的视觉注意机制,也就是当人眼接触一个视觉场景时,会注意场景中更为显著或者更为感兴趣的区域,然后视作为重要区域进行优先处理。根据这一特性,目前已经有很多基于显著性的计算模型。在此基础上也有很多学者提出将任务驱动的模型与其结合,从而能够对特定的图像进行分类和识别。本文以视觉显著性的计算模型为基础,进行图像识别的研究。首先介绍了人眼视觉的生理结构,分析了基于视觉信息处理机制的视觉显著性计算模型和利用具有先验知识的贝叶斯识别模型。接下来,详细的阐述了将ITTI显著性模型和贝叶斯模型相结合的图像识别算法。该算法在提取显著性特征后,选用高斯密度分布函数来拟合特征值得到训练参数,并作为先验知识。在识别时,基于训练参数进行贝叶斯识别。这一模型较好的实现了基于先验知识的视觉特征,进行有目的的图像识别和分类。本文的研究内容主要是基于该模型提出改进的算法。其次,研究了贝叶斯模型中似然函数的估计方法。原模型中主要采用高斯概率密度函数来拟合特征值的分布,但随着训练图片的增多,特征值包含的信息更丰富,分布更复杂,单一高斯模型的误差更大。本文选用的混合高斯模型弥补了这一不足,通过对特征值进行聚类,然后对每一聚类进行单一高斯拟合,有效地提高了拟合精度从而提高识别的效率。基于混合高斯模型的思想,提出了一个根据特征值的分布特性自动选择其分布函数的自适应系统。这一系统采用两个判定,根据特征值分布的特点,在单一高斯、双高斯以及混合高斯模型中进行选择。从而提高了处理速度和识别效率。为了提高自适应系统的识别效率,本文又结合ITTI显著性模型的特点,提出了改进的显著性度量的方法。主要是基于已经学习到的图像集合的特征分布特性,为每幅子特征图添加权值系数,从而更加突出显著区域。经过多次实验发现,这一基于统计特性的加权方法,在特定的图像数据库中是有效的,能提高自适应系统的识别效率。但是其广泛的适用性还有待进一步研究。本文提出的改进算法主要是基于显著性引导的图像识别系统。在给定某一对象的多幅训练图的前提下,本系统经过学习得到对象的一个具体描述,然后对包含对象的待测图像进行识别,给出这个图片会被正确识别的概率列表。本文针对ALOI图像数据库进行大量的实验,结果显示,本文提出的改进算法有效的提高了识别的效率,并且此自适应系统在时间消耗上小于混合高斯模型。
其他文献
<正>随着时代的嬗变,当代艺术的概念在今天信息化、多元化的文化表征下被不断解构重建。未来的中国当代艺术走向核心依然是体系与标准问题,关键在于本土文化情境的回归与当代
生物医药产业作为典型的高新技术产业,已经成为世界经济上发展最快的产业之一。生物医药产业自身对知识和技术有强烈的需求,尤其是技术创新、药品研发等过程更依赖于与相关企业
利基市场是市场竞争的必然发展,"长尾理论"以其独到视角为利基市场提供了丰富的营销价值,必将对我国小企业营销产生深远的影响意义。
文章介绍了火力发电厂输煤系统特点以及各种类型的火力发电厂输煤控制系统,对火力发电厂输煤控制系统的发展前景进行了分析。
本文厘定并阐述了辽西地区燕山中生代板内造山带东段发育的逆冲推覆构造的宏观构造格局、运动学特征、形成时代和形成过程;探讨了形成该构造体系的区域构造背景及其大地构造
一般来说,在400 mm以下降水量的气候区,栽植大乔木就很难成活[3],要依靠退耕还林,培养新的经济增长点,发展有市场前景的经济林[4].
政府并不是市场的外部参与因素,而是市场中重要的一部分。在市场经济中,政府的宏观经济政策的使用才会是整个市场更加完善。宏观经济政策主要包括货币政策和财政政策。相比于发
对鄂尔多斯盆地不同地区上三叠统延长组砂岩的岩石学、储层物性与成岩作用特征及其分布与变化规律的对比研究表明,盆地东部与盆地西部延长组来自不同物源区。压实作用是造成
针对瓦楞纸箱印刷特点和控制要求,以SIMOTION D445-2多轴控制单元为主控制器研究开发瓦楞纸箱印刷控制系统。采用SIEMENS系列产品,搭建基于控制器、伺服系统和人机交互界面的
随着网络技术和经济的发展,电子商务已经成为一种非常重要的市场运作模式,深深地改变了人们的思维方式和生活理念,影响了整个世界的生产经营和商品流通。而由农民专业合作社来充