粗糙集与支持向量机结合的方法在连续属性离散化中的应用

来源 :东北大学 | 被引量 : 0次 | 上传用户:w11122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集和支持向量机都是为了从数据中提取固定模式而提出的数据挖掘方法。粗糙集理论适用于海量数据,支持向量机是在统计学习理论基础上提出的分类方法,它的结构风险最小化准则和核函数理论,避免了“维数灾难”和“过学习”等传统方法的缺点。本文将粗糙集和支持向量机相结合,利用两种方法的优越性,提出了一种先用粗糙集进行预处理,再用支持向量机精确分类的方法。本文首先介绍了粗糙集和支持向量机的基本理论,对粗糙集的下近似、上近似、决策规则以及支持向量机的结构风险最小化原则、核函数等理论做了简要的回顾,分析了两种方法在数据挖掘领域的优势和局限性。然后,针对以往连续属性离散化方法分类规则复杂、会丢失大量信息的问题,提出了基于粗糙集下近似理论的离散化方法。这种方法可以对海量数据进行预处理,将根据粗糙集理论肯定属于某一类别的样本提出,并删除样本数据中可能的噪音数据,得到部分决策规则。这种方法不会破坏原数据集的不可分辨关系,而且得到的分类规则简洁。接着,利用支持向量机方法只与支持向量有关的特点和能够精确分类的优势,将经过粗糙集预处理的数据用支持向量机方法精确分类。最后,仿真实验表明,该方法在缩短训练时间的基础上,保留了支持向量机方法所需的分类信息,去除了样本数据中的噪音数据,提高了分类精度,克服了SVM算法的应用瓶颈。
其他文献
在现在的物理考试中,物理试题特别灵活,重在考查学生的思维。观察物理试题就会发现,实验题越来越多,而且占的分值也比较大,这影响着学生的物理成绩。在初中的物理教学中,老师
1990年,日本著名拓扑学家K.Chiba证明了在λ-仿紧条件下正规、集体正规等拓扑空间的逆极限运算是保持不变的.最近十多年来,我国拓扑学者熊朝晖、蒋继光等在正规σ集体正规、δ-
作文教学,在整个语文教学中占有重要的地位,它不仅是我们重点的教学内容,而且也是一个不容忽视的问题。同时,又是一个非常棘手的难题。那么怎样解决这个问题呢?我认为只要把握好这
本文讨论如下四阶半线性发展方程ut+△2u=|u|p,(x,t)∈Ω×(0,t]的初边值问题,其中Ω包含于R2为有界区域。初始条件为u(x,0)=u0(x),x∈Ω。  对于边界条件,我们分别考虑下面
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
小学科学是以培养科学素养为宗旨的科学启蒙课程。科学课堂是培养学生实践探究能力和创造精神的重要载体。本文结合了自己开展实验教学的一些做法,就规范科学实验操作,提高实
差分方程的振动性研究是差分方程定性理论研究的一个重要组成部分.在实际生活中,如生物数学、经济学等学科中提出的模型大量的应用了差分方程作为数学模型来描述. 本文分
本文主要运用微分不等式的技巧(或称为上下解方法),在一定条件下证明几类非线性微分方程边值问题(不带小参数)解的存在性(部分内容包括解的唯一性),并在此基础上研究带有小参数
在新课程标准下,高中生物课的教学内容与方法发生了很大的改变,一改往常的强调教学内容的教学模式,现在生物课教学更加关注学生的学习经验与体验。本文探讨了在高中生物实验
随着计算机技术的迅猛发展,给教育教学带来了无限生机。多媒体技术与语文教学的有机整合能有效提高课堂教学效率,增强学生的语文综合素养,促进高中语文教学方式的革新。本文从多