基于选择性集成学习的支持向量机分类研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户：pjzh210427

【摘要】

：

近些年来，随着科技的迅速发展，导致数据量的不断增多，这在无形中带来了很多的问题，比如很多数据需要进行分类和整理，单纯的依靠人工去分类这些数据将会产生非常大的工作量，给人们的

【作者】

：

扈晓君

【机构】

：

山东师范大学

【出处】

：

山东师范大学

【发表日期】

：

2015年期

【关键词】

：

支持向量机 Adaboost算法 Bagging算法特征选择集成学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近些年来，随着科技的迅速发展，导致数据量的不断增多，这在无形中带来了很多的问题，比如很多数据需要进行分类和整理，单纯的依靠人工去分类这些数据将会产生非常大的工作量，给人们的工作和生活带来诸多的不便。而机器学习作为一个可以帮助人们解决这类问题的方法越来越引起了人们的关注。现如今，机器学习在疾病诊断、生物信息识别、地理信息系统等领域都得到了相关的应用和研究，为人们的生活和工作带来了很多的方便。集成学习作为一种可以将多个分类器整合的机器学习方法也在发挥着越来越重要的作用。一般集成学习系统相比较弱分类器个体来说，它的集成学习效果要好一些。因此之前关于集成学习的研究多集中于与弱分类器的结合，对于如何与SVM这种强分类器去进行有效地集成的研究并不多见。对此，本文所做出的工作主要可以分为以下几个方面：1、提出基于Bagging算法的SVM选择性集成结合Bagging算法以及选择性集成理论，提出基于Bagging算法的SVM选择性集成方法。首先通过Bagging算法的Bootstrap方式对原始数据集合进行选取，得到训练子集合，然后在原数据的特征集合中随机选取出特征子集合，并且在该训练子集合上进行投影，得到所需要的输入数据，通过这种改变输入样本的方式来解决弱化SVM分类器的问题，并且使得各个子分类器之间产生一定的差异性；其次，算法结合选择性集成的理论，对于产生的各个子分类器进行精度上的排序，选取出部分精度较好的子分类器进行集成，解决了集成的个体需要保证一定准确率才可提升整体性能的问题，使得整体性能得到改善，同时降低了所需的计算资源。2、提出基于Adaboost算法的SVM选择性集成结合Adaboost算法的迭代加权过程，以及选择性集成方法，提出基于Adaboost算法的SVM选择性集成方法。算法首先结合SVM的分类特点，将SVM分类中较难和较易分类的部分数据提供给Adaboost算法，同时在算法的迭代过程中根据准确率的计算来调整SVM的核参数，通过这两种方式解决在Adaboost算法中弱化SVM个体学习器的问题，同时解决个体学习器的差异性，以及预测准确性要保持在一定水平的理论问题；其次，在构成集成学习系统的过程中结合选择性集成方法，提出一种新的选取子分类器的方法，其通过将个体准确率与整体系统准确率进行比较，将符合整体准确率要求的子学习器加入到最终的集成学习系统中，改善系统的准确性，减小集成系统的规模。集成学习与强学习类型的分类器进行结合的主要问题就是如何达到集成学习中弱学习器、个体差异性以及准确性这三个方面的平衡，只有处理好这三个方面才可以达到较好的效果。

其他文献

面向大数据集查询的索引与数据组织优化研究

作为新一代的IT商业模式，云计算受到了广泛关注。然而，云计算在急速发展的同时也带来了一系列的问题，首当其冲的就是云端数据的有效管理问题。如何高效的管理云端数据、提高系统

学位

大数据云计算多维数据索引副本

基于视频的奶牛识别系统——奶牛图像识别的研究

优化奶牛品种、提高牛奶产量与品质是奶业生产中的核心环节。奶牛体型线性评定是奶牛优化育种工作的一项重要内容，其主要目的是通过评定来预测奶牛的产奶能力，同时估测育种值，组

学位

奶牛识别系统图像预处理阈值分割算法特征提取

面向单机驱动的多通道投影系统的图形应用程序移植与绘制技术

高分辨率应用程序在日常生活中使用广泛,对于这些应用程序,可以使用高清平板液晶显示器或等离子显示器作为输出设备。然而,此类设备受到物理的限制,显示屏幕的尺寸有限。与其

学位

多通道几何校正颜色校正函数截获

基于嵌入式Linux说话人识别系统的研究

近年来,说话人识别技术日趋成熟,说话人识别作为生物认证技术的一种,有它独特的优势,比如声音是非接触的,自然的,用户比较容易接受。由于语音这一媒介自身特殊的优势,通过声

学位

说话人识别特征提取VQARM嵌入式系统

基于神经网络的网页排序学习算法研究

随着互联网的发展，搜索引擎的重要性与日俱增。如何有效的查找需要的信息是非常关键的，一个好的搜索引擎可以极大的节省用户查找信息的时间。搜索引擎包含多个组成部分，其中网页

学位

神经网络文档位置权重网页排序学习算法搜索引擎RankNet算法

The Design of an Autopilot Controller for an Unmanned Aerial Vehicle

This thesis describes the design，implementation and testing of a fullyautonomous and programmable autopilot system for small scaleautonomous unmanned aerial vehi

学位

UAVMUXAutopilotGPSFMA Co-PilotGCS

片上网络拓扑结构及其路由机制的研究

随着芯片制造技术的发展，单个芯片中可以集成更多的IP(Intellectual property)核，片上系统的总线结构已经不能适应系统芯片的发展，因此一种全新的集成电路体系结构NoC(networks-

学位

片上网络拓扑结构路由算法性能分析

支持QoS全局优化的动态Web服务组合问题研究

Web服务作为一种新型的分布式计算模型,以其自包含、模块化、松散耦合、基于标准、高度可集成能力等优点成为当今工业界和学术界共同关注的焦点。但是,单个Web服务功能有限,

学位

Web服务组合Web服务组合模型服务选择服务质量QoS约束

MPSoC通讯架构的研究

随着集成电路制造技术的进步及市场对功能需求的提升，在SoC中的处理架构也在持续地演进，为了达到更高的处理效能，多处理器片上系统(MPSoC)已成了新一代SoC的主流设计趋势。采用

学位

集成电路多核结构片上系统芯片设计

数字媒体节目的传输控制技术

通信网络的发展经历了从简单到复杂,从集中到分布的过程。近几年数字编码技术的不断提高,促使流媒体技术发展很快,并已经应用在视频点播等领域。为提高网络应用性能,CDN(Cont

学位

交互式网络电视内容分发网络对等网络文化共享

基于选择性集成学习的支持向量机分类研究

其他学术论文