论文部分内容阅读
随着互联网(Internet)的快速发展和多媒体数字化信息采集设备的普及,每天都有大量的数字图像、视频等多媒体信息产生。为了从海量的图像库中获取用户需要的图像,基于内容的图像检索技术逐渐成为一个研究热点。传统的图像检索系统通常抽取图像的底层特征(颜色、纹理和形状等)进行检索,但这种基于全局的方法具有一定的局限性,它忽略了图像中不同的区域对人眼视觉系统吸引程度不同这一事实。因此本文将视觉注意模型应用到图像检索中,通过视觉注意模型找到人们感兴趣的显著区域,再进行图像检索。本文在视觉注意模型、显著区提取、图像特征提取等方面都进行了研究,主要的研究内容如下:1、视觉注意模型是提取原图视觉显著区的基础,它决定了显著区提取的视觉效果。本文采用Song视觉注意模型的计算方法流程,主要包括基本特征通道高斯金字塔生成,特征图生成,显著图融合等步骤。由于Song模型在特征图生成阶段采用固定的窗口进行中央周边差运算,使得对于尺度较大的显著区,该模型不能较好地提取区域的中间显著部分。针对此缺点,本文改进了Song模型,根据图像高斯金字塔序列中,图像分辨率的不同,分配不同尺度的计算窗口,分辨率较高的图像分配较大的窗口尺度。实验结果表明,改进的视觉注意模型较Song模型能更好地刻画视觉显著图的内部区域。2、在显著区提取方面,由于视觉显著图只能描述像素点的显著性而不能描述区域的显著性,因此本文将显著图和图像分割算法结合。先用图像分割算法获取图像的各个区域,然后结合视觉显著图计算各个区域的显著性,最后通过三条筛选规则获取原图的显著区。3、在图像特征提取方面,由于基于全局特征的方法将图像的背景区域也用于特征提取,这样既不能准确描述图像的主体内容,又浪费了计算资源。为解决这一问题,本文仅对显著区提取特征进行图像检索。同时,针对部分显著区中背景和主体内容掺杂的图像,本文改进了BDIP-BVLC特征的计算方法,通过对显著图进行数学形态学操作,获取显著区的二值图,并且二值图中值为0的局部块不参与特征提取运算。实验结果表明,本文方法在查准率和查全率上优于基于全局特征的方法,同时也优于基于视觉显著模型的显著性加权方法。另外本文基于显著区改进的BDIP-BVLC特征较原特征有更高的查准率。