【摘 要】
:
提高分类的准确率是数据挖掘和机器学习等领域一直关注的重要研究课题。组合方法是目前比较流行的机器学习算法之一。但是大部分组合方法都存在一个共同的问题:倾向于构建大量
论文部分内容阅读
提高分类的准确率是数据挖掘和机器学习等领域一直关注的重要研究课题。组合方法是目前比较流行的机器学习算法之一。但是大部分组合方法都存在一个共同的问题:倾向于构建大量的基分类器。这样势必会加大内存需求和延长响应时间。组合修剪是处理该问题的一种有效方法,即选择全部基分类器的一个子集作为组合分类器来对未知样例进行预测。目前比较成熟的组合修剪方法有向前选择、向后选择和向前向后选择。这三种方法都是以贪心搜索的方式增加或删除一个基分类器,收敛过快,很容易达到局部最优,严重影响了修剪后所得组合分类器的性能。针对以上组合分类器修剪方法容易达到局部最优,本文从增大搜索空间的角度出发,提出了一种基于束状搜索的组合分类器修剪方法(EPBBS)。该方法使用束状搜索策略对基分类器进行选择,在每一步增加或删除一个基分类器时都保存最优的前k个组合。既保持了原有组合修剪方法中贪心搜索算法的高效剪枝特性,又有效减小了贪心搜索过快收敛到局部最优解的可能性,使修剪得到的组合分类器更接近于全局最优。除了算法的理论分析外,本文还设计了三个实验,分别从分类性能和组合规模的角度与原有的组合修剪方法向前选择、向后选择和向前向后选择进行对比。实验结果与分析表明,EPBBS算法在大部分数据集上都具有更高的分类性能,而且组合规模也有所降低。
其他文献
在非结构化P2P网络中,节点由于受到内部能力差异、搭便车行为和高扰动(High Churn)特性的影响,负载度呈现出严重的失衡,对网络的健壮性和可用性形成了严重的影响,同时也造成
无论在虚拟的大型3D游戏、影视作品中,还是在海洋勘探等领域,大规模海洋仿真有着非常重要的应用。目前的海洋仿真研究中大多聚焦在海面建模层面,或者只实现某一个海洋光学表
不平衡数据在实际应用中广泛存在,如何从不平衡数据中学习并获得分类器成为了当前机器学习研究领域的一个热点。该方面的研究已经取得了一定的成果,并在入侵检测、信用卡交易
按需式距离矢量路由协议AODV是一种经典的按需路由协议,已经得到了广泛的应用。在AODV的实现中,网络节点根据首次接收到的RREQ报文建立反向路由及前向路由,对于重复接收的RRE
随着“互联网+”时代的到来,移动互联网迎来了新的发展时机,智能手机作为移动互联网的主要入口之一发展迅速,其设备性能与普及度都有很大的提升。Android系统作为最受欢迎的
无线传感器网络是由大量具有感知、数据收集、数据处理和无线通信能力的小体积、低成本的传感器节点构成的无线自组织网络,能够对大范围区域进行有效监测,并对监测数据进行处
随着软件行业的繁荣发展,软件系统的规模和复杂度急剧增长,对软件进行优化和维护越来越困难。软件缺陷预测通过分析软件特征,利用机器学习技术构建预测模型,在软件测试前定位
老的影视资料由于胶片老化、脱落以及反复播放、转存、复制的过程中受到刮伤等原因,播放时在画面中出现了如斑点、闪烁、划痕、抖动、褪色等问题。另外,当前节目制作过程中由
带约束路由算法问题一直是通信领域的热点问题。然而,多数特殊约束路由问题为NP-完全问题,除非NP=P,否则无法给出多项式时间算法。对于这些问题,已经出现各种伪多项式算法,但这些
近年来,日常需要处理和传输的数据越来越多,数据压缩也变得越来越重要,而其中文本是数据的一个重要组成部分,因此对文本数据的压缩研究就成为了压缩领域研究的一个重点。基于