AdaBoost学习机制及其在物体检测和识别中的应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:fjkdkfjkldsjk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
让计算机视觉系统自动定位图像中的物体和区分物体类别,使其具备简单的分类决策能力是本文研究的出发点。主要研究内容包括学习方法的改进、分类器的设计、视觉物体检测和视觉类别识别四个方面。  (1)在AdaBoost学习框架下,引入生成式、判别式和多参照点聚类三种模型改变训练样本的空间分布,从而研究三种弱分类器学习方法。  AdaBoost是一种组合多个弱分类器为一个高度精确强分类器的加法模型,基于重新分布的训练样本构造弱分类器是其核心之所在。在详尽分析推导AdaBoost算法基础之上,本文从生成式、判别式和多参照点聚类三个角度研究弱分类器的学习,从而提高其性能。生成式模型以正例样本集的高斯拟合形式实现。判别式模型通过最大化类间散布和类内散布的比值,寻求两类分类的最佳Fisher投影方向。在基于多参照点聚类的模型中,首先依据训练样本聚类出k个参照点,然后采用四种量度计算每个训练样本到k个参照点的距离,从而重新分布样本空间。  (2)从分类器合并的角度,研究PIS-POS策略来构造五种似然函数分类器,借助“词集合”模型的思想研究体现多分支决策的树状分类器构造方法。  合并分类器目的是挖掘驻留在各种分类器中的信息,AdaBoost强分类器依据加法模型合并多个弱分类器,Viola和Jones利用纵向组合强分类器的思想构建了层叠分类器。在层叠分类器基础之上,为充分利用强分类器的层次信息和众多弱分类器的实数值输出,本文研究PIS和POS两种策略分别从横向和纵向组合分类器实现联合决策,从而构造出PIS-CA、PIS-EA、POS、S-PIS-POS和A-PIS-POS五种似然估计分类器。为实现多分支决策,本文借助“词集合”模型的思想,引入树状结构组合多个强分类器,其中非叶子节点挖掘了不同类别间的共性信息。  (3)基于变换域内模板区域的直方图特征集,利用生成式和判别式两种弱分类器学习方法,构建物体检测范畴的两个层叠结构人脸检测系统。  作为一个两类分类问题,区分出物体出现的区域和背景区域是视觉物体检测的目的,本文以人脸检测作为其实现载体。在AdaBoost学习框架下,用Intensity、LoG/DoG和Gabor三个滤波器组获取人脸在变换域内不同尺度和方向的时空特性,通过统计模板区域的直方图构建人脸的边缘分布,从而形成用于人脸检测的新特征集。然后利用生成式模型(高斯拟合方法)和判别式模型(Fisher线性判别方法)分别学习弱分类器并构造两个层叠结构的人脸检测系统。  (4)用感兴趣区域、SIFT区域描述符、参照点中心以及距离量度共同刻画物体类别,利用多参照点聚类方法学习弱分类器,以树状分类器的构造策略合并分类器,从而研究视觉类别识别方法。  视觉类别识别指在多个不同的视觉类别间进行彼此区分。首先利用六种感兴趣区域检测器获取训练图像中包含的所有感兴趣区域,再通过类内层的滤波和类间层的组合两个步骤提取重要的感兴趣区域,然后计算感兴趣区域的SIFT特征,再用多参照点聚类的方法学习弱分类器,最后依据词集合的思想构建视觉类别识别树。树的非叶子节点体现了一“袋”类别共享特征的情况,从根节点到叶子节点的唯一路径表示一个视觉类别。  总之,本文通过改进AdaBoost学习中的弱分类器学习,研究模式识别领域新的分类器设计方法,构造了视觉物体检测和视觉类别识别两类计算机视觉系统。
其他文献
无线Ad hoc网络以其布网灵活、易与迅速展开、系统整体抗毁能力强、不依靠预设的网络基础设施等特点可广泛应用于国防战备、抢险救灾、应对突发事件等无法得到有线网络支持或
现实生活中,企业的兼并,高校的重组,河流的汇聚,林区的连片,植物的嫁接,电网的交融等等均展示了同类对象融为整体的组合归并现象。如果从数据处理的角度考虑,并把企业、高校
当今互联网深刻地影响着人们生活的各个方面,网络在为工作和生活带来越来越多便利的同时,也引起了诸多安全和管理的问题。网络流量分类是网络管理的基础,也是检测网络恶意攻
伴随着计算机图形硬件技术不断地更新换代,各类主流三维游戏对于阴影渲染的实时性与可交互性提出了更高的要求。同时,随着大型复杂光照环境在游戏、电影及动面中的广泛应用,
词典普遍被作为一种含有大量语言学知识、常识知识的知识库。传统英语词典中一般包含词形、词性、词义、例句、习语、各种语法语用说明以及出处、领域等注解。从传统词典中提
现在,计算机软件系统逐渐变得越来越复杂,本身的开发难度更是在不断增加。传统的开发方法主要依靠手工方式,效率低下、质量欠佳、正确性难以保证。泛型程序设计(Generic Prog
随着电信服务市场竞争的日益激烈,各运营商意识到,单纯的“价格战”已经不能满足企业发展的需要,而不断深入的企业信息化则成为了各运营商提升自身竞争力的重要手段。电信企
评论挖掘就是对评论文本的挖掘与分析,包括对文章主客观性的判断和评论褒贬义的判断以及句子层的评论文章基本要素的抽取,如抽取评论对象的名称,特征,评论词以及态度倾向等。
单芯片多处理器(CMP:Chip multi-processors)是高性能微处理器结构设计的发展方向。片内多个处理器核共享cache可能会导致共享数据不一致的问题,为此提出了两种协议机制:监听
天然岩石节理裂隙普遍存在于各类岩石中,了解节理裂隙的性质对于地质、地球物理、采矿、石油工程、水文地质以及核废料隔离都具有重要意义。岩石节理裂隙研究的一项重要内容