基于边界点的局部线性支持向量机算法

来源 :南京大学 | 被引量 : 0次 | 上传用户:TRACY101688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代又被称为大数据时代,其特点就是人们已经被各种各样的大规模数据包围。在这种背景下,机器学习渐渐取代了领域专家成为处理大数据的强有力工具,并且已经成功应用于人类生活的诸多领域中(例如电商、新闻阅读、征信、广告投放等)。然而,传统的机器学习算法依旧面临着不小的挑战。首先就是如何高效地处理大规模数据,其次则是如何处理在线流数据。支持向量机算法(Support Vector Machine,SVM)作为最经典的机器学习算法之一,也面临着同样的问题。简单地说,线性SVM算法速度很快且具备在线学习的能力但是无法处理非线性可分数据;核SVM能够处理非线性可分数据但是速度很慢且不具备在线学习的能力。为了能够高效地处理非线性流数据,本文展开了基于边界点的局部线性支持向量机算法的研究。我们提出了这样一个研究思路:基于边界点将非线性数据划分成近似线性可分的若干小块;每一块使用一个线性SVM进行分类并最终构造一条分段线性的分界面。具体地,我们首先提出了一种基于边界点编码的局部线性支持向量机算法(Local Linear SVM based on Boundary Anchor Points Enchoding,LLBAP)。LLBAP首先学习出边界点并采用基于边界点的局部编码将训练集划分成若干小块。其次,LLBAP在每一小块上训练一个线性SVM并最终构造一个分段线性且光滑的分界面。LLBAP是一个批量算法,其无法处理在线数据。为了解决这个问题,我们对LLBAP进行了一些改进,进而提出了本文的第二个算法—增量式的集成专家网络(Incremental Network with Local EXperts Ensemble,INLEX)。与LLBAP不同的是,INLEX中使用了一种基于熵的在线边界点学习方法并将线性SVM的在线训练与边界点的在线学习相融合,从而具备了在线学习的能力。在大规模数据上的实验结果表明:LLBAP的分类性能仅仅略差于核SVM但是却拥有与线性SVM相当的训练和预测速度;从分类性能、训练速度和预测速度三个方面综合考虑,LLBAP的性能也优于其他的同类方法。此外,INLEX的实验结果同样证明INLEX具有稳定的增量性能以及优于同类算法的分类性能。
其他文献
在实际工作场景中,数据的特征和标签往往会不同程度缺失,这种情况被称为数据具有不同的浓度。例如文本分类的数据中包含着大量未标记的文本,临床信息预测实验中包含很多缺失
高超声速滑翔导弹是一种新型的组合导弹,它具有射程远、飞行速度快、升阻比大、机动性能强的优点,能够有效突防,实现对目标的精确打击。同时导弹集群协同作战具有良好的鲁棒
随着深度学习技术的快速发展,人脸检测技术取得很大的进展,成为近年来计算机视觉领域中的一个研究热点。然而,人脸检测易受到尺度变化、光照变化、遮挡方面等因素的影响,使得
水轮机调速系统作为水电站控制的核心,其控制性能的优劣将对电力系统的稳定性产生一定的影响同时也影响着电能的质量,但是由于在实际工况下存在着多种不确定因素,使得水轮机
目前,国内外建筑施工中采用的再生混凝土其骨料主要是再生碎石粗骨料,而很少选择再生卵石作为粗骨料,现有规范中也没有关于再生卵石混凝土的相关规定。同时,由于卵石与碎石在
水泥生产是一个能源密集型的工业制造过程,其生产过程中伴随大量温室气体和污染物的排放,对能源环境安全造成威胁。作为主要的高耗能高排放行业之一,实现水泥行业的节能减排
中药渣是一种典型的生物质资源,我国每年产生大量废弃中药渣,其基本处理方式是填埋和固定区域堆放,既浪费资源又污染环境。通过热化学转化技术将中药渣合理地利用,将会产生较
近年来随着人类生活水平的提高,人们对建筑物的品质也相应提高,如对住房功能的需求不单单满足于传统的保温隔热,遮风挡雨等,现逐渐追求其安全、舒适、美观等性能。框架结构是
随着中国城市的发展,发电厂的结构安全变得尤为重要,而冷却塔是其中的重要构件,因此对其抗震性能的研究具有重要意义。鉴于目前国内外对冷却塔抗震性能的研究均是基于其正常
如今,国家正在大力发展装配式建筑。装配式建筑是把以前需要在施工现场浇筑成型的梁、柱、楼板等,提前在工厂里面生产出来,然后运到现场,“组装”成一个完整的建筑。其优点有