论文部分内容阅读
单类分类器作为一种概念学习方法,旨在描述目标数据,因而区别于两类分类器,成为分类器设计中的一个新分支,受到众多学者的关注和重视。本文针对目前单类问题的研究成果从密度方法和支持域方法两方面进行阐述总结,并围绕两类设计方法展开研究。主要工作包括:1、对单类分类器的研究主要从密度方法和支持域方法两方面进行阐述和归纳,同时总结了单类分类算法的评价指标。通过对现有方法的梳理,总结了各类方法的优缺点,指出相关算法存在的不足及有待改善之处,从而确定本文的研究重点。2、充分挖掘目标数据包含的先验信息提高泛化能力,提出局部密度嵌入的结构单类支持向量机(ldSOCSVM)。以SOCSVM作为基本框架,将数据的局部密度信息嵌入其中,充分利用数据全局信息的同时进一步挖掘出数据的局部密度信息,使两类信息相互补充。ldSOCSVM继承了结构单类支持向量机的稀疏解及鲁棒性且具有更强的数据描述能力。作为通用框架,上述思想可进一步推广应用于现有诸多算法中。3、将最大对比度分类器(MCC)的设计思想推广应用于单类问题,提出基于最大化约束密度的单类分类器(MCDOCC)。受启发于MCC:坚持概率密度模型的框架且遵循以任务为导向的思想,且注重密度估计与分类目标的整体性,MCDOCC修改核密度估计赋予其参数化的混合因子,并通过最大化目标类约束密度优化概率密度估计,采用线性规划优化且具有稀疏解。实验表明MCDOCC具有与Parzen窗及OCSVM相当的推广性能。文章进一步挖掘少量异常数据的先验信息,设计出带负类的最大化约束密度单类分类器(NMCDOCC),提高分类器泛化能力。