论文部分内容阅读
图像分割被广泛应用于图像编辑、目标跟踪等领域,是计算机视觉中最重要的基础任务之一。完全自动的图像分割的概念是模糊的,因为人们感兴趣的部分是不确定的,而完全人工的分割耗费太多的时间。因此,要想精确地实现前景与背景的分割,就必须要以某种方式指定用户感兴趣的前景。目前,指定用户感兴趣的方式有两种:(1)以人机交互的方式指定前景与背景进行图像分割,此种交互式图像分割算法。(2)以多张图片的共同前景作为用户感兴趣的前景,以此方法进行图像分割的算法为协同分割算法。现存的交互式图像分割和协同分割算法主要是基于生成式模型的,基于生成式模型的算法具有精度高的优点,然而其建模过程较为复杂,而判别式模型较为简单,也相对更容易拟合,此外,在增加新的类别时,判别式模型不需要重新训练,因此,设计基于判别式模型的图像分割算法是很有必要的。本文旨在设计基于判别式模型的交互式图像分割算法和协同分割算法并研究算法性质,主要工作如下:(1)针对交互式图像分割问题,本文基于半监督流形正则化框架训练得到分割分类器来实现基于判别式模型的交互式图像分割算法。具体做法是将交互式图像分割问题转化为半监督的二分类问题,用人的交互对超像素样本进行标记,然后利用基于流形正则化的半监督学习框架训练得到分类器,最后用分类器对多数未标记的超像素样本进行预测,得到分割结果。为了验证算法性能、研究算法性质,本文在Grabcut和BSD300数据集上进行实验。经过实验,验证了基于流形学习的交互式图像分割算法具有良好的分割效果,在Grabcut图片数据集上的分割错误率小于已有方法,用户交互的种子点的个数对分割效果的影响不大,但是用户交互的错误种子点的个数会很大程度影响分割效果,最后通过观察不同图片的分割效果,可以看出,本文算法对于前景与背景特征空间重合较大的图片分割效果不佳。(2)针对协同分割问题,本文提出了基于多任务流形学习的协同分割算法。算法主要步骤是,首先利用协同显著性检测算法得到所有图片可能的前景与背景的区域,以此对超像素样本进行标记,然后在多任务学习框架中加入流形正则化项进行约束,训练得到多个分类器,再分别对图片所有超像素的标签进行预测,最终得到分割结果。本文在iCoseg数据集上进行实验,验证了算法具有很好的分割精度,并将其扩展至Jumpcut视频数据集,在对视频帧的分割时依然具有较好的效果。