论文部分内容阅读
随着科学技术的发展和信息的日益丰富,机器视觉受到了广泛的重视。如何应用计算机模仿人类处理图像的机制来快速而准确地将海量图片进行识别和分类,需要同时结合计算机科学、生物物理学以及心理学的研究。通常,这类研究会结合基于人眼的视觉注意机制,也就是当人眼接触一个视觉场景时,会注意场景中更为显著或者更为感兴趣的区域,然后视作为重要区域进行优先处理。根据这一特性,目前已经有很多基于显著性的计算模型。在此基础上也有很多学者提出将任务驱动的模型与其结合,从而能够对特定的图像进行分类和识别。本文以视觉显著性的计算模型为基础,进行图像识别的研究。首先介绍了人眼视觉的生理结构,分析了基于视觉信息处理机制的视觉显著性计算模型和利用具有先验知识的贝叶斯识别模型。接下来,详细的阐述了将ITTI显著性模型和贝叶斯模型相结合的图像识别算法。该算法在提取显著性特征后,选用高斯密度分布函数来拟合特征值得到训练参数,并作为先验知识。在识别时,基于训练参数进行贝叶斯识别。这一模型较好的实现了基于先验知识的视觉特征,进行有目的的图像识别和分类。本文的研究内容主要是基于该模型提出改进的算法。其次,研究了贝叶斯模型中似然函数的估计方法。原模型中主要采用高斯概率密度函数来拟合特征值的分布,但随着训练图片的增多,特征值包含的信息更丰富,分布更复杂,单一高斯模型的误差更大。本文选用的混合高斯模型弥补了这一不足,通过对特征值进行聚类,然后对每一聚类进行单一高斯拟合,有效地提高了拟合精度从而提高识别的效率。基于混合高斯模型的思想,提出了一个根据特征值的分布特性自动选择其分布函数的自适应系统。这一系统采用两个判定,根据特征值分布的特点,在单一高斯、双高斯以及混合高斯模型中进行选择。从而提高了处理速度和识别效率。为了提高自适应系统的识别效率,本文又结合ITTI显著性模型的特点,提出了改进的显著性度量的方法。主要是基于已经学习到的图像集合的特征分布特性,为每幅子特征图添加权值系数,从而更加突出显著区域。经过多次实验发现,这一基于统计特性的加权方法,在特定的图像数据库中是有效的,能提高自适应系统的识别效率。但是其广泛的适用性还有待进一步研究。本文提出的改进算法主要是基于显著性引导的图像识别系统。在给定某一对象的多幅训练图的前提下,本系统经过学习得到对象的一个具体描述,然后对包含对象的待测图像进行识别,给出这个图片会被正确识别的概率列表。本文针对ALOI图像数据库进行大量的实验,结果显示,本文提出的改进算法有效的提高了识别的效率,并且此自适应系统在时间消耗上小于混合高斯模型。