增强型单类分类器研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:richardwang_wjw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单类分类器作为一种概念学习方法,旨在描述目标数据,因而区别于两类分类器,成为分类器设计中的一个新分支,受到众多学者的关注和重视。本文针对目前单类问题的研究成果从密度方法和支持域方法两方面进行阐述总结,并围绕两类设计方法展开研究。主要工作包括:1、对单类分类器的研究主要从密度方法和支持域方法两方面进行阐述和归纳,同时总结了单类分类算法的评价指标。通过对现有方法的梳理,总结了各类方法的优缺点,指出相关算法存在的不足及有待改善之处,从而确定本文的研究重点。2、充分挖掘目标数据包含的先验信息提高泛化能力,提出局部密度嵌入的结构单类支持向量机(ldSOCSVM)。以SOCSVM作为基本框架,将数据的局部密度信息嵌入其中,充分利用数据全局信息的同时进一步挖掘出数据的局部密度信息,使两类信息相互补充。ldSOCSVM继承了结构单类支持向量机的稀疏解及鲁棒性且具有更强的数据描述能力。作为通用框架,上述思想可进一步推广应用于现有诸多算法中。3、将最大对比度分类器(MCC)的设计思想推广应用于单类问题,提出基于最大化约束密度的单类分类器(MCDOCC)。受启发于MCC:坚持概率密度模型的框架且遵循以任务为导向的思想,且注重密度估计与分类目标的整体性,MCDOCC修改核密度估计赋予其参数化的混合因子,并通过最大化目标类约束密度优化概率密度估计,采用线性规划优化且具有稀疏解。实验表明MCDOCC具有与Parzen窗及OCSVM相当的推广性能。文章进一步挖掘少量异常数据的先验信息,设计出带负类的最大化约束密度单类分类器(NMCDOCC),提高分类器泛化能力。
其他文献
第三代合作伙伴计划(3rd Generation Partnership Project,3GPP)考虑到互联网和传统运营商的融合,引入了IP多媒体子系统(IP Multimedia Subsystem,IMS)作为核心网的发展方向
由于技术的发展以及成本的降低,基因组测序在孟德尔遗传疾病,复杂疾病,以及癌症基因检测中得到了运用,并产生了海量的测序数据。这些数据对研究疾病的致病机制、疾病的临床诊
基于位置的服务(Location Based Service, LBS)是根据用户的位置信息提供服务的一种移动通信应用服务。在给用户带来便利的同时,现有LBS的工作机制也使得用户面临个人信息,甚
在当今信息化世界中,中文信息处理技术已经在各个领域中得到了广泛的应用。本文主要对中文分词算法中的基于分词词典机制的最大匹配算法进行研究讨论。由于中文语法语义复杂导
在飞速发展的交流调速系统中,交流变频电机作为主要的拖动方式已逐渐占据主导地位,在生产实践中的应用越来越广泛。而在采用了绝缘栅双极型晶体管(IGBT)器件的脉冲宽度调制(PWM)型变频器后,变频电机却出现了寿命问题,其中变频电机用漆包线耐电晕性能是制约其寿命的一个重要方面,这时就需要特定的测试仪器能够有效检测漆包线耐电晕的性能。在深入研究漆包线耐电晕测试相关技术的基础上,本文采用了IGBT的H桥技术
产品评论挖掘就是从用户发表的评论中挖掘出产品特征、用户观点,并判断观点极性,为生产、营销商家和潜在的用户提供参考。通过对提取出的产品特征进行分析,发现用户对产品特征粒
安全协议分析和验证在信息安全领域占有重要地位。目前,安全协议形式化方法分析和验证主要集中在对实用性较差的安全协议抽象规范分析和验证方面,对注重实用性的安全协议代码分
图像分割是计算机视觉与图像处理领域的重要研究课题,其变分方法可集成多种因素以提高分割的自动化程度,但传统变分模型计算效率较低等缺点制约了该方法的工程应用。本论文针对
人类阅读载体由纸质载体向电子化的方向转化以及电子辅助阅读工具的出现将是人类未来阅读发展方向的必然。现有的大部分研究基本都是外文图像的分析,国内对于图像版面分析和理
为提高 web应用的安全性,笔者所在课题组提出一种应用程序切片技术的web分析模型,对网页代码进行大规模分析,旨在发现安全规则和安全漏洞。本文则主要研究静态程序切片及其在安