基于粗糙集的并行约简研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:nathan_zk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是数据挖掘的重要工具,也是粒计算理论的一个重要分支。经典粗糙集是由波兰学者Pawlak于上世纪80年代提出来的。粗糙集理论通过对象间的不可区分关系(等价关系),为不完全和不充分信息的处理提供了一套系统的方法。当前粗糙集理论已经成为计算机科学、信息科学、人工智能等领域的研究热点。知识约简是粗糙集理论的重要应用,也是其核心问题之一。知识约简是指在不改变整个数据集的分类能力的情况下,消去信息系统或者决策表中的冗余。由于数据集本身的复杂性和传统约简方法的局限,在处理海量数据时,粗糙集理论没有体现出它应有的活力。许多学者在知识约简方法的改进上做了大量的探索。例如并行约简的概念。并行约简是近两年出现的知识约简研究的热点,它利用并行计算的思想和方法,应用到基于粗糙集的数据挖掘当中。并行约简的概念比较新,理论体系、方法和技术等均有待完善,目前还没有一种高效的并行属性约简算法,值得研究和探索。本文围绕基于粗糙集的并行约简定义、性质的讨论,对不同形式的数据集进行子表抽样,子表并行约简和提取决策规则展开。论文所做的工作有:(1)针对不同的数据特点,引入相应的并行约简定义,并进行局部的扩展和算法研究。本文一共定义了三种类型的并行约简:基于正域的并行约简、基于差别矩阵的并行约简以及基于属性重要度的并行约简,并同时完成了这三种形式的并行约简算法设计。(2)针对基于正域的并行约简的条件限制,提出了变精度并行约简概念,并对变精度并行约简的性质进行了讨论。(3)针对不同性质的数据集,设计了不同的子表抽取策略。并在如何对海量数据进行子表抽样问题中,提出了一种聚类抽取子表的方法。(4)对现有的决策规则提取方法的局限性进行了分析,针对增量式规则提取,给出了一种解决方法。
其他文献
[摘 要] 工程教育专业认证的核心理念与重要环节之一是对专业建设的持续改进,而持续改进的关键是基于评价发现问题,并将评价结果通过机制用于改进。本文以工程教育认证的持续改进理念为原则,以郑州轻工业大学为例,分别从课程体系、教学活动和师资队伍等3方面介绍了过程装备与控制工程专业具体实施持续改进过程中的一些策略。   [关键词] 工程教育专业认证;评价;持续改进;过程装备与控制工程   [中图分类号
[摘 要] 随着全球一体化和多元化的不断深入,跨文化交际能力越来越受到重视,也已成为21世纪国际人才应具备的能力之一。任何语言若是离开了主观性就不能称之为语言,不同文化背景的人进行交际时,必然离不开自己的观点、态度、想法等主观因素,即语言的主观性。本文基于输入-输出理论,建构了基于现代信息技术的主观性视角下国际人才跨文化交际能力培养模型,从四方面探讨基于现代信息技术的语言主观性视角下的大学英语跨文
[摘 要] 当前校本培训存在缺乏针对性、内容空洞、流于形式的弊端。基于教育会诊的校本培训借鉴医院的会诊制度,旨在以解决问题为导向,对教师在教育教学中存在的普遍共性和典型个性问题,借助同伴和专家学习共同体的教育合力,通过集体讨论,共同诊断的方式给予解决方案并得以实施的一种校本培训路径。通过对教师的教育教学问题收集与分类,从而得出解决方案,提高校本培训的实效性,促进教师的专业素养的提升。   [关键
随着数据库技术和网络技术的发展,分布式数据库系统越来越受到人们的关注。由于分布式数据库的分布性和逻辑整体性的特点,如何保证分布式事务提交的原子性,是分布式数据库系
随着我国航天技术的不断发展,越来越多的卫星应用在通讯、资源探测、遥感、气象、对地观察等领域,卫星的功能越来越强,对星务管理和有效载荷控制的星载计算机提出了更高的要
学位
近年来随着软件产业的蓬勃发展,软件的规模、复杂程度大幅度提高,同时用户对软件又有了更高的可靠性、安全性要求,开发的时间更短,为满足这些要求,软件企业采用了一系列的技