基于边界的模糊支持向量数据描述研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:liu1513
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习领域中,模式分类问题一直是研究主流。分类问题主要可以分为两大类:一个是多分类问题包括两类分类问题;另一类是单类分类问题。由于复杂度或代价的原因,在很多情况下我们只能获取一个类别的数据信息,所以只能用这一类别样本进行训练学习,称之为单类分类问题。  本文研究的内容是基于支持向量数据描述(Support Vector Data Description, SVDD)的分类器,它是一个被广泛应用的单类分类器。SVDD的核心思想是通过使用核方法把训练样本从原始空间映射到一个新的高维空间,从而构建一个超平面。然而,传统的SVDD并没有考虑到样本的结构信息,忽视了样本分布的问题,空间位置不同的样本对于分类边界的贡献度是不同的,本文认为位于边界的样本点对于分类边界的影响程度比类内样本点高。因此针对单类SVDD,本文提出了基于边界的模糊支持向量数据算法;针对SVDD两类模型,提出了基于类心距离的模糊支持向量数据算法。这两个算法的共同点都是关注于数据集的边界样本点。本文主要贡献在于:  第一,SVDD单类模型并没有考虑到样本分布的问题,所有样本对于分类边界的贡献度是相同的,由此导致了SVDD对于噪声点敏感度高,当处理噪声点较多的数据集时,分类效果不佳。基于此,本文提出了基于边界的模糊SVDD算法,通过自定义的全局-局部中心距离算法来判断样本点是否为边界样本点,由于SVDD是基于支持向量来构建分类边界,而支持向量又处于边界的位置,因此本文提高边界样本点的权重,降低类内样本点的权重,同时降低了噪声点的影响。另一方面,样本数量不足会导致不充分学习,从而影响分类器的分类效果。不平衡数据集中,少数类由于样本数量不足,SVDD对其进行分类,效果不佳。由于本文主要关注于边界样本点,能够降低样本数量不足导致的不充分学习带来的影响。实验结果表明此算法提高了分类精度,有较高的可行性。  第二,SVDD只有一个类别的数据信息进行训练学习。研究表明,加入负类样本进行训练能够提高SVDD的分类精度,这就是SVDD带负类模型。然而,同SVDD单类模型一样,SVDD带负类模型也没有考虑到样本分布问题,对噪声点敏感度较大。基于相同的考虑,本文提出了基于类心距离的模糊SVDD算法,重点也是基于边界样本点,同样选择加强边界样本点的权重,降低两类类内样本点的权重来降低噪声点的影响。与SVDD单类模型不同的是,本文采用样本到两类类中心距离来判断边界样本点。实验结果显示此算法能有效提高分类的精度,有较高的适用性。  本文基于传统SVDD没有考虑样本分布的原因,分别对SVDD单类模型和带负类类模型进行样本模糊化处理,提高分类的精度,为SVDD处理单类和多类问题提供了新的思路,而且基于边界的思想能够运用到其它分类器的实际应用研究中,有较大的启发性和推广型。
其他文献
Web服务组合能够重用Web服务资源,尽最大的能力提供满足用户需求的服务,已成为目前研究的热点。Web服务种类越来越多,如何扩展Web服务类型的组合方式、实现服务的无缝组合是当今
近几年,随着社交网站SNS(Social Network Site)的快速发展,如:Facebook,Renren,YouTube等,社会网络分析已经成为一个非常热门的研究领域。社区结构,作为社会信息网络中最普遍
随着计算机技术的快速发展,计算机网络已经与人们的生活形影不离,然而网络攻击手段繁多,令人防不胜防,比如网络内部攻击、绕过防火墙的攻击,等等。作为网络安全第二道防护墙的入侵
现实中大多数无线传感器网络为满足特定的需求而建立与维护,它的作用是为企业、机构、个人等提供专有的服务,对于系统之外的客体很难对其进行利用,随着物联网的逐渐发展,开放
视频的语义标注对于其自动检索具有重要意义,而视频对象提取可以为视频高级语义事件的标注与检索提供重要的推理依据。网球比赛视频具有巨大的商业价值和广阔的应用前景,是当前
虚拟装配技术利用计算机对产品装配过程和结果进行深入分析、仿真和评价,达到在不需要实际产品的支持下,快速做出与产品制造和装配相匹配的工程决策,因此受到人们的广泛关注。本
交通运输网是以交通运输网节点和节点间的连线构成的一个复杂带权的网络,是一个节点和边有机的集合,其节点的重要性评估,与节点间的运输能力,阻抗,以及交通路网的拓扑结构等
学位
大型网络中链路的可靠性非常重要,直接影响网络的可用性。链路故障会降低网络的性能、中断网络连接。有资料表明链路故障每天都在发生,所以监测网络链路故障的发生以及分布规
互联网应用的高速增长为电信增值业务的发展带来了新的契机和挑战,如何借鉴互联网发展的先进经验,利用互联网开放的技术成为电信增值业务发展的重要课题。开放平台为互联网应用