论文部分内容阅读
随着数码相机和智能手机的普及,以及网络和微博的快速发展,数字图像和视频已经成为日常生活中最受欢迎的一种信息表现和传递沟通的媒介。每天海量的数字媒体信息汇聚到互联网中,为人们的娱乐、教育、安全和商业带来便利的同时,数据量呈现几何级数增长态势,已经远远超过现有计算机拥有的处理能力。人们需要将有限的计算资源用于处理数字图像中的重要部分,也对视觉信息处理技术提出了新的挑战。人类及其他灵长类动物的视觉系统能实时充分地感知外界的环境信息,并能迅速准确的检测感兴趣区域并进行跟踪处理。受此视觉感知与注意机制的启发,计算机视觉选择感兴趣目标区域,而对于图像的其他部分视而不见的过程称为显著性检测。显著性检测作为预处理阶段已经广泛应用到计算机视觉的各个研究领域。虽然目前已经研发出许多性能优越的显著性计算模型,但是想要获得像灵长类动物的视觉系统一样鲁棒的自适应的模型仍然存在较大的难度和挑战。本论文受视觉感知与注意机制的启发,提出了四种显著性检测模型能准确的高亮整个显著性目标区域,同时有效的抑制背景区域。本论文的具体内容可以总结如下:(1)针对现有的显著性检测模型的表示方法的不足之处,本文提出了一种自表征学习的显著性目标检测方法。根据流型假设,局部相似的区域具有相似的表示,也就是说相似的局部区域将投影同一个子空间中。通过图正则约束的自表征学习方法对图像进行分解,使得相似的局部信息具有相似的表示,从而能更精确的检测显著性目标。根据背景假设,该方法将图像边界的所有区域当做背景字典。背景区域和显著性目标区域在背景字典上将被分解到不同的子空间中,从而在子空间中将显著性目标区域和背景区域分离开来。通过大量的实验验证,该方法能获得均匀高亮的显著性区域,同时能有效抑制背景区域。(2)针对传统稀疏编码中表示系数的独立性问题,提出了一种局部图正则的稀疏重构显著性检测方法。传统稀疏编码框架对每个区域进行独立表示计算,忽略了相邻区域之间的内在的关系。图拉普拉斯正则项是一个考虑了图像的局部相似性结构保持项。该方法将图拉普拉斯正则项引入到传统的稀疏表示框架中,能使相似的区域具有相似的稀疏表示系数,从而得到均匀高亮的显著区域。由于背景假设并不是对所有的图像都成立,该方法提出了由图像的边界信息去除前景噪声构成启发式背景字典。该方法相比传统的稀疏编码算法能获得更具有判别性的有效的表示。在六个显著性数据集上的实验结果表明本章的算法更具有鲁棒性和普适性。(3)提出了利用视觉注意机制和似物性线索的目标层的显著性检测方法。通过观察发现,颜色属性扮演着非常重要的作用。无需有监督的学习或随机采样大量无关的矩形区域,仅仅使用量化后的颜色属性就能快速有效的得获得少量的目标相关的候选区域。该方法使用了两个测度:候选区域的似物性度量和全局的线索分别用来计算候选区域的目标性和整个图像的自底向上的视觉注意。候选区域的似物性对目标的候选区域和图像剩余的区域进行聚集性和外观差异的测量。同时,采用颜色属性的关注度和空间分布对整个图像进行显著性计算。最后,将候选区域的显著图和全局的显著图进行融合获得最终的显著图。实验表明将局部的目标性线索加入到全局的低层的显著性线索中能提高处理复杂图像的能力。本章提出的算法能快速并准确的检测到显著区域,并能有效处理一些复杂背景的图像。在三个公开的显著性数据集上用五个评价标准对该方法和现有的十五种算法的性能进行评价。该方法能快速准确的获得均匀高亮的显著性目标区域。(4)受人类视觉感知机制的启发,提出一种半监督自表示的显著性检测方法。根据观察发现,显著性目标检测是一个背景和目标信息相互验证的过程。并不是一个单一的过程,单独使用图像的背景或者目标作为先验进行对比都可能产生误检。该方法使用注视预测模型提取可能的目标区域种子,用非目标区域种子的图像的边界区域为背景种子,分别进行半监督的自表征学习优化,检测一致则为显著性区域,否则是背景区域。最后将所有的可能的显著目标进行融合获得最终的显著图。在六个公开的显著性检测数据库上的大量实验对比评测表明本方法具有明显的优越性。