基于粗糙集和支持向量机的多值分类算法

来源 :河北农业大学 | 被引量 : 3次 | 上传用户:kingstarKS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(SVM)是近年来发展起来的基于小样本的新的通用学习技术。该技术具有坚实的理论基础、强泛化能力,分类精度高且能收敛至全局最优解。但它是二值分类器,不适用于多值分类场合及处理海量数据。粗集理论则具有处理和约简大数据量的优势,但分类精度不如SVM方法。本文利用粗集理论对数据进行预分类,在此基础上提出两种二值分类数据组合方法,然后,再利用SVM两两分类。这样,既解决了多值分类问题,提高了分类精度,又实现了数据压缩。其中利用主属性中不可分辨关系(或相近关系)预分类的方法,概念清晰,易于理解、操作,数据压缩量大。 以某属性的等价类(相近类)组成的子集作为SVM的训练集预分类的方法如下。 (1)将连续性训练数据离散化。 (2)去掉离散化后不可分辨的属性。 (3)将决策表进行属性约简,值约简。 (4)计算每个属性的等价类数目,选择等价类数目最多的属性作为主属性。如有多个属性的等价类都具有最多的等价类数目,则选择等价类中包含类别数最少的属性。 (5)让每一个等价类(或相近类)作为一个子集,作为SVM的训练集。得出SVM决策函数。 (6)在每个子集所在离散空间用相应的决策函数进行分类。 本算法利用一个主属性的不可分辨值将样本空间分成多个子集,然后在这些子集中再进行SVM测试。这样既压缩了数据,又保证了分类精度。 通过仿真试验,表明算法是可行的。
其他文献
诗谓韭曰:“一畦春雨足,翠发剪还生.”春韭,清香味美,壮阳却病,自古以来就是受人喜爱的食疗佳蔬.rn我国种韭,源远流长.殷周古籍《夏小正》有载“正月囿有韭”;西周时,韭与葫
期刊
该文试验工作主要在大连理工大学近海及海岸工程国家重点实验室进行.试验目的是寻出各种海况条件下,影响网箱受力的主要因素及各因素的影响大小和相互关系.试验工作主要包括
学位
随着我国经济在快速发展,社会在不断进步,我国工程建设在不断加强,脚手架用于建筑、市政等工程领域也比较广泛,文章对施工中常见脚手架的质量问题进行了概述,对脚手架安全管
生活中,很多人都有憋尿的经历,比如开一个很重要的会议,或是玩一局快要通关的游戏,原本尿意很急,但却非要憋着.实际上,膀胱比我们想象得脆弱,一些坏习惯会让它生病.
期刊
分布式数据库系统是物理上分散而逻辑上集中的数据库系统。分布式数据库的使用提高了数据库系统的可靠性、可扩展性、信息容量以及部门协同工作等各方面的能力。但随着Intern