支持向量机多分类器的研究与应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:joeworms
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网就像是一个巨大的数据仓库,里面包含了文本、图像以及视频等各种类型的数据,这些数据由于来源的不同呈现出了异质与非结构化的特点。为了对这些数据进行有效的管理与存储,便于人们快速地从中找到有用的信息,数据挖掘作为一种解决方法迅速成为了一个研究热点。支持向量机是数据挖掘领域常用的一种机器学习算法,它凭借着有效防止过拟合的特性在分类领域得到了广泛应用。针对日常分类问题中常见的多分类问题,支持向量机产生了多种不同的组合式多分类算法,本文针对其中两种组合式多分类结构进行深入研究与分析,提出了两种改进的支持向量机多类分类算法,主要内容如下:DAGFSVM)算法。针对有向无环图多分类问题中经常会出现噪音点的情况,设定了一个模糊间隔函数,利用该模糊间隔函数来判断一个样本是否真实属于此类别,如果不是,就赋予比较低的模糊值,削弱其对于最终超平面的影响。另外,再设定一个分离度函数来衡量各个二类分类器的准度,将那些成功率高的放置到根节点旁边,从而尽量保证有向无环图结构的准确率。2、提出了一个基于模糊间隔的自适应二叉树支持向量机多分类(Binary Tree Support vector machines based on fuzzy interval,BTFSVM)算法。针对二叉树多分类问题中经常会出现误差累积的情况,首先设定一个类间距离函数来衡量类别之间的关系,将相近的类别聚在一起,从而使得数据依据自身的特性来构造偏二叉树或者近似完全二叉树,实现两种结构的自适应;另外,采用模糊间隔函数与辅助惩罚因子来有效的平衡二叉树层次结构分类中不均衡分布对于最终分类结果的不利影响,提升每个单体二分类器的性能,从而进一步提升整体模型的准确率。3、将本文提出的两种支持向量机多分类算法在不同的数据集上进行比较,总结出各自的优劣势;然后基于这两种算法的优劣势,构建一个简易的基金评级系统。基金评级系统的数据由爬虫从新浪的基金数据中心爬取,爬取的数据各特征之间通过标准化来消除取值范围对于精度的影响,然后依据本文提出的两种不同的多分类算法分别进行训练,得到快速以及精准两种不同的基金评价模型,最终再依据规模设定单一评价以及批量评价两个接口,从而对不同规模的基金数据实现简单的评级操作。
其他文献
通过对哈尔滨体育学院排球专项及普修学生进行的调查,总结了排球教学中常易出现的运动损伤,并结合排球运动特点分析了运动损伤的产生原因并提出相应预防措施。
通过收集《黄帝内经》以降的代表著作及著名医家关于湿邪致病性质、产生条件及致病特点等内容,阐述病因之"湿"的相关概念及理论辨析。中医学病因之"湿"的存在形式多样,来源广
目的:探讨颅脑损伤法医病理特征。方法:选取2010年2月至2016年2月进行法医病理解剖的80例颅脑损伤案例,均行法医病理系统解剖操作。结果:本次选取的颅脑损伤案例80例,均由头
党的十八届三中全会强调要允许更多的国有经济和其他所有制经济发展成为混合所有制经济。国有资本投资项目允许非国有资本参股。军工企业是国有企业的重要组成部分。作为特殊
本文介绍了自适应低通滤波器的原理以及自适应算法,并举例说明了如何用MATLAB软件设计自适应低通滤波器。
针对目前高架桥匝道运营过程中出现的常见病害,结合高架桥匝道结构的力学特性,明确影响高架桥匝道安全性的各种因素,采用层次分析法(AHP)建立高架桥匝道结构的安全评估模型.最
当前,我国正在积极实施标准化战略,党中央、国务院高度重视,标准化工作达到前所未有的新高度。国家机关事务管理局《机关事务工作“十三五”规划》也已经明确强调要加强机关
为了调查广东地区水禽源大肠杆菌对氨基糖苷类药物耐药现状和耐药基因的流行情况,探索大肠杆菌的氨基糖苷类耐药基因型与耐药表型之间的关系,本研究采用琼脂梯度稀释法测定25
消除贫困,实现共同富裕,是我国2020年实现全面建成小康社会的重要目标任务,我国贫困地区特别是西部连片特困地区作为我国扶贫工作的主战场,目前仍旧面临贫困人口众多且分布分
<正>1白菜白锈病白锈病为白菜的重要病害,分布较广,长江流域发生较重,一般病株率10%~20%,轻度影响产品质量。严重时病株率可达50%以上,致40%~60%叶片染病,显著影响白菜的产量