图像内容显著性检测的理论和方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:djf344010190
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类的视觉系统可以在广大的、复杂的动态及静态场景中快速定位出最吸引注意的内容,这种能力被称为显著性检测。吸引注意的内容因此被叫做显著性(内容),一般来说显著性的某种特征与周围有很大差异,例如某些危险警示标志。视觉系统的显著性检测能力可以使我们更聚焦在视觉场景中的某一局部,而对场景中的其它背景部分视而不见,从而当我们面对外界的刺激时可以优先处理部分信号并更快速的做出反应。随着图像视频获取捕捉设备的发展,数据规模越来越大、内容越来越复杂,因此早期的计算机视觉算法逐渐不能胜任现如今的任务。所以,人们试图设计算法模拟人类视觉系统的显著性检测能力,来找出图像中的部分重要内容进行后续分析处理并忽略掉冗余信息,从而加速整个任务的执行。显著性检测的结果可以应用于很多计算机视觉任务,例如物体检测和识别[9][52][80][81]、图像分割[84][85][86]、图像和视频压缩[82][83]、图像重定向[53][79][100]、视频摘要[88][89][90]、视觉跟踪[94][95][96][97][98][99]、基于内容的图像检索[87]、图像编辑[91][92][93]等。因为显著性检测的重要性,它越来越受到重视并被大量研究,很多显著性检测模型相继被提出。在计算机视觉的显著性检测领域,根据任务的不同,显著性检测有两个分支:通用的显著性检测和特定的显著性检测。而根据结果的特点,每个分支还可以进一步分为视觉显著性检测和显著性物体检测两类。通用的显著性检测任务,目的是查找自然图像中吸引人注意的区域或物体,这些区域或物体没有明确的类别。而特定的显著性检测,一般是根据不同任务在图像中查找某种类型的区域或物体,比如照片中的人脸、监控中的汽车、医学图像中的肿瘤。本文全面研究了图像内容显著性检测的理论与方法,从多个角度、多个方面分析了现有的显著性检测模型,并提出了新的特征、模型和评价方法,对显著性检测领域做出了较大贡献。主要创新点包括:总结了视觉显著性检测模型和显著性物体检测模型两类模型的发展,并且汇总了两类模型的显著性特征、评价数据库和评价方法,发现这两类模型有很多相似点。进一步分析,两类模型都有三个主要组成部分:特征对比方式、显著性提取方向以及线索结合方法,再次说明了两类模型的紧密关系。提出了一种通用的显著性物体检测模型UFO[10],在该模型中提出了聚焦度(focusness)和物体度(objectness)两种显著性特征,其中聚焦度可以通过尺度空间分析进行估计而物体度则由修改的物体检测算法计算。最后,非线性结合广泛使用的独特度(uniqueness)得到UFO模型。该模型在当时国际上最大和最难的显著性物体检测数据库MSRA1000和BSD300上,及统一的评价体系下,取得了领先的结果。提出了一种对基于扩散的显著性物体检测模型的改进方法。通过分析现有的基于扩散的显著性物体检测模型,我们对该类模型的工作机制有了一种全新的解释,我们发现基于扩散的显著性物体检测模型的性能与扩散矩阵和种子向量都有关,并且性能上限由扩散矩阵决定。因此,我们提出了一种通过重新合成扩散矩阵和构建种子向量来提高模型准确性和效率的方法。之前大多数基于扩散的显著性物体检测模型只关注于种子向量的生成,但是我们通过大量实验,包括视觉显著性提升能力、及我们提出的受限最优的种子点效率(COSE),充分证明了我们重新合成的扩散矩阵有更强的扩散能力,可以使种子向量的显著性信息更精确的传播到整个显著性物体。同时,视觉显著性提升能力的实验为改造视觉显著性检测模型来检测显著性物体提供了一个途径。最后,我们结合重新合成的扩散矩阵及构建的种子向量得到GP模型[11]。我们在当时最大的两个数据库MSRA10K和ECSSD上进行显著性物体检测的实验,GP在大多数评价方法下都取得领先水平。提出了一种特定的显著性物体检测模型。具体来说,该模型实现了一个算法,来自动的检测乳腺超声图像中的肿瘤位置并勾绘出肿瘤轮廓。该模型首先利用AdaBoost分类器找出所有潜在的肿瘤区域,再利用SVM分类器进一步把真实肿瘤区域筛选出来。最后将检测出的肿瘤区域及非肿瘤区域的中心作为前/背景种子点,利用Random Walks分割算法得到肿瘤轮廓。实验证明,该模型可以准确定位肿瘤位置并精确勾绘肿瘤轮廓,此外该算法也可以应对包含多个肿瘤的超声图像。
其他文献
随着股权分置改革的稳步推进,证券市场将步入全新的“后股权分置时代”,即股权全流通时代,消除了中国资本市场的制度性障碍,资本市场的发展迎来全新的时代。资本市场估值体系和游
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
计算机视觉系统的最终目标是要获得自适应能力、自学习能力、在各种解决方案中权衡的能力、对新的上下文情景和应用场合进行泛化的能力,以及和其它系统(包括人)进行沟通的能
本文结合闵行区新一轮总体规划的编制工作,在深入剖析闵行区增量发展的各个阶段基础上,识别制约当前发展的三大重要瓶颈。基于相关理论、研究与实践,对闵行区现存的主体过多
在标签理论的视角下,HIV/AIDS人员受歧视源于其被贴上不良标签,而标签化又使HIV/AIDS人员的种种权利受到侵害,使其对自己丧失信心,逐渐形成不良的自我形象,导致进一步的越轨
利益分配是科学发展评价体系的基础,社会关系是本质,规则是核心,理念是灵魂;四者以丰富的内涵和紧密的逻辑关系,架构成科学发展的评价体系。本文通过揭示四者在科学发展评价体系中
<正>今年是改革开放40周年,也是国际税收40周年。在我们进入建设新时代中国特色社会主义的伟大历史时刻,回顾这段难忘的历史,展望国际税收的发展前景,对于适应新时代需要,高
随着我国市场经济的深入发展,企业间的竞争日趋激烈。在激烈的市场竞争中,影响企业生存的主要威胁均来自其面临的财务风险和危机。本文提出了筹资活动环节设置预警指标和警度、
为进一步丰富甲基酮类席夫碱的种类,以5-氟-2-羟基苯乙酮为原料,通过与盐酸氨基脲、苄胺、邻苯二胺和4-氨基安替比林的缩合反应合成了4种新的5-氟-2-羟基苯乙酮席夫碱,并采用
<正>人蛔虫是一种最常见的人体消化道寄生虫,引起蛔虫病。蛔虫成虫寄生于人体小肠,夺取营养,也可引起肠梗阻、肠扭结、肠穿孔、胆道感染和阻塞引起阑尾炎等急腹症,甚至还可以