【摘 要】
:
支持向量机(Support Vector Machine,SVM)作为一种基于统计学习理论的新的机器学习方法,克服了神经网络方法解不稳定、推广性差的缺点。目前,SVM已经成为机器学习领域的研究
论文部分内容阅读
支持向量机(Support Vector Machine,SVM)作为一种基于统计学习理论的新的机器学习方法,克服了神经网络方法解不稳定、推广性差的缺点。目前,SVM已经成为机器学习领域的研究热点。传统SVM是针对两类分类问题,而实际问题大多是多分类的。如何有效地解决多分类问题,是近几年研究的重点之一。基于二叉树的SVM多分类算法已被广泛采用,但不同的二叉树结构对SVM分类器的性能影响很大。针对基于二叉树的SVM多分类算法在时间复杂度和分类效果上的不足,本文提出一种完全二叉树(Full Binary Tree,FBT)的改进球结构SVM多分类算法。该算法考虑不平衡样本的分类情况,利用改进的球结构SVM在提高分类精度的同时,建立结构合理的完全二叉树,将多类问题转化为一系列的二分类问题,二叉树的每个中间结点代表一个分类器,同一层的分类器能并行工作,从而可以提高训练和分类的速度。通过理论分析和实例验证,并且与其他多类分类算法相比较,该算法有令人满意的分类效果。随着样本数量的增加,传统的SVM缺乏对增量学习的支持,需要所有的训练样本都参与训练,因此训练速度会明显减慢。针对球结构SVM增量学习算法在训练时间和分类精度上的不足,本文提出一种改进的球结构SVM多分类增量学习算法。该算法在FBT的改进球结构SVM多分类算法的基础上,分析球结构SVM分类器的KKT条件,分析新增样本的加入对原来支持向量集的影响,将新增样本集中部分样本和原始训练集中的支持向量以及分布在球体一定范围内的样本合并做为新的训练集,完成分类器的重构。在UCI标准数据集上进行测试,与球结构SVM增量学习算法相比,该算法具有较短的训练时间和较高的分类准确率。
其他文献
从20世纪80年代后半期至今,信息技术的飞速发展和计算机的小型化、微型化,使得计算机开始大量进入生产管理领域,这些信息技术的应用对于提高企业的竞争力无疑起到了很大的作用。随着消费者对产品需求的不断提高、产品更新换代速度的不断加速,企业如何快速的响应市场并有效的组织生产,制定生产计划成为当前生产制造企业普遍关注的问题,也成为企业在国际竞争中取得胜利的关键。本文对批量生产方式下生产计划模式进行研究,分
物流配送是物流活动中直接与消费者相连的环节。在物流的各项成本中,配送成本占了相当高的比例。配送线路安排的合理与否对配送速度、成本、效益影响很大,特别是多用户配送线路
目前,组成人机界面的大多数外围器件都是单独控制的,还有一部分是集成了简单的输入和输出器件控制的专用芯片。这些外围器件集成到应用系统所需I/O口资源比较多,功耗大,成本高,所
近年来,大型起重机吊装行业迅猛发展,超大型吊装日渐普遍,推动了用于辅助吊装方案设计人员快速有效制定作业方案的计算机辅助吊装仿真技术的广泛应用,而现存的仿真工具在吊装动作序列规划上的低效性问题也日益突出。本文重点研究了基于随机采样思想的高自由度动作搜索算法——RRTConnect,针对其在动作规划中因树生长缺乏方向性、所得路径迂回严重、平滑性较差而导致路径代价大、规划时间长、路径质量差的问题,提出了
随着计算机网络技术的发展,无线网络技术已经为人们带来了极大的方便。但同时值得注意的是,无线网络安全问题也成为了无线网络技术应用和普及的一个主要障碍。而身份认证是网
软件复用一直是软件工程中一个热门课题,通过软件复用,可以减少不必要的重复劳动,提高软件生产的效率和质量。但是现代的企业应用软件越来越复杂,研究人员试图寻找一种软件体
随着信息技术的飞速发展,一种新型的企业模式——虚拟企业,得到了迅速发展,并吸引了众多研究人员的关注。虚拟企业(Virtual Enterprise)是一种联合供应商、制造商、经销商及
随着现代信息化建设步伐的加快,笔录录入电子化已成为趋势。而检察院对笔录有系列的特殊要求,如笔录的安全性、实时性等等,通用的编辑工具并不能够满足这样的要求。如何针对
随着多媒体和网络技术的飞速发展,基于内容的图像检索CBIR成为当前多媒体信息检索研究的热点之一。它的主要思想是根据图像所包含的颜色、纹理、形状以及对象的空间关系等低