论文部分内容阅读
随着时代的发展和进步,图像和视频成为了我们获取外界信息的一种非常重要的媒介和手段,所以如何很好地处理这些信息也就变得越来越重要。视觉作为人类获取外界信息最主要的手段,其信息处理能力远优于现有的任何计算机视觉系统。因此,如何把视觉系统感知和处理外界信息的机制应用到计算机实际处理中来,引起了人们的广泛关注。长期以来,心理学、神经系统学和计算机视觉等领域的研究表明人类的大脑和视觉神经系统对图像中的某些目标会有更多的注意,我们称这些目标为显著目标。显著目标检测不仅对人类视觉感知是一项重要的任务,同时对计算机视觉应用也很重要。显著目标在工程上的应用甚广,如目标检测和识别、图像和视频压缩和人机交互等。在这些应用中使用显著目标,我们可以更好地保留目标的信息。本文主要从视觉注意模型的角度对图像显著目标检测算法进行研究,建立基于视觉感知机制的显著目标提取方法。本文研究内容分为以下两个部分:(1)不同于常用的基于像素的或基于超像素的显著目标检测方法,本文提出了一个基于区域的显著目标检测方法,该方法使用现有的高质量的图像分割方法来简化显著目标检测,从原理上更符合人类视觉感知机制。对于一幅输入图像,首先使用现有的分割方法(g Pb-OWT-UCM)对图像进行分割,然后计算分割图像三个非常简单的特征,就可以很容易的从分割后的图像中提取出显著目标。最后在一些数据库上,和现有的一些显著目标检测方法进行了比较,本文提出的方法都有较好的表现。(2)本文另一个研究内容是提出了一个基于格式塔理论的显著目标检测方法。在分析和理解人类视觉系统处理信息的过程的基础上,基于视觉感知机制中视觉搜索引导理论,本文对现有的一个显著结构检测模型进行了改进。首先在非选择性通路上,基于格式塔知觉组织原则,使用一些图像结构特征(整体上)找到目标区域的可能位置,作为先验信息;在选择性通路上,提取图像的亮度、颜色、纹理等局部特征。最后利用贝叶斯理论整合两种信息,并使用自动迭代终止操作,得到最终的显著目标图。我们在一些数据库上,对本文提出的方法和现有的一些方法进行了比较,分析并总结了优势和不足。最后我们做了两个补充验证实验,进一步分析了该方法的性能和可行性。