基于粗糙集的高效增量属性约简算法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:dragon122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据在实际应用中呈现出多种变化形式。对象增加、维度增加和属性值变化是数据动态变化的三种重要类型。在粗糙集理论中,动态数据的属性约简问题一直备受关注。然而,现有的属性约简算法大多都只适用于静态数据集的处理。基于这些算法获取动态数据的属性约简,不能有效利用已有知识,而是在更新后的决策表上重新运行当前算法计算约简。显然,这种方法非常耗时甚至有时是不可行的。为了提高属性约简的效率,已有学者提出了基于决策表区分矩阵的增量算法。这种算法利用增量信息更新决策表区分矩阵,进而计算更新后决策表的所有约简。但需要指出的是,由于同一个等价类中的元素条件属性完全相同,导致这些元素在矩阵中对应位置也完全一致,即矩阵中存在着重复的矩阵项。这在很大程度上降低了矩阵的更新速度。  基于上述分析,本文针对数据动态变化的三种类型,分别给出了相应的增量约简算法。主要工作如下:  1.针对对象动态增长的数据,构造了正域意义下、香农熵意义下、互补熵意义下压缩决策表的区分矩阵,分析了三种代表性区分矩阵在对象动态增长时的更新机制,设计了基于压缩决策表区分矩阵的增量属性约简算法。  2.面向属性动态增长的、属性值动态变化的数据,分析了正域意义下、香农熵意义下、互补熵意义下决策表区分矩阵的更新机制,提出了基于决策表区分矩阵的增量算法。  3.为了进一步改善面向属性动态增长数据、属性值动态变化数据的增量算法的性能,定义了一种新的压缩决策表,构造了该压缩决策表的三种区分矩阵,分析了这些区分矩阵在属性动态增长和属性值动态变化时的更新机制,并设计了基于新压缩决策表区分矩阵的增量属性约简算法。
其他文献
近年来,随着计算机图形学技术的飞速发展,大量的三维模型被应用于动画、电影、3D游戏和广告等领域中,大量开放的三维模型数据库也已经出现。如何快速低成本让用户准确查找目
随着互联网的发展,搜索引擎已经成为互联网最重要的入口之一。在搜索引擎的组成部分中,网页排序是搜索引擎设计的核心问题,排序结果的准确性决定了搜索引擎的性能和用户体验。早
某省人力资源和社会保障部门继2011年运行浙大网新版核心平台一版后,又推出了“多险合一”的核心平台二版。养老保险是“多险合一”社会保险制度的重要组成部分。本文在严格遵守核心平台二版规范和试点城市业务需求的前提下,经过分析养老保险待遇业务的实际需求和业务流程,并结合系统集成和项目管理的先进思想,设计和实现了一个针对养老保险待遇业务的业务系统。首先,本文在讨论“多险合一”社会保险系统项目背景和对其开发
在过去的几年,移动设备的数量在飞速的增长,如智能手机、平板电脑等。在智能手机市场,安卓系统的市场份额是最高的。与此同时,针对移动设备的安全威胁也越来越多,由于安卓系
在电脑普及、信息爆炸的现代社会,网络已经成为主流咨询媒介。目前,高校大学生学习、生活、娱乐之类的咨询主要通过现场、电话咨询和网络咨询等方式,而涉及到的这些问题往往
信息技术的飞速发展使得无线传感器网络(Wireless Sensor Network)逐渐成为信息技术领域内一个新兴的研究方向。无线传感器网络有着功耗低,成本低,分布广泛,自组织等优势,另一方
在无线通信系统中,连接可靠性和数据高传输率是重要的性能指标。由于多径衰落、阴影和路径损耗等的干扰,信道质量在时间、频率和空间上将产生随机不确定性,导致无线通信质量
软件缺陷作为困扰用户及软件开发人员的难题,不仅增加软件组织的成本、危害了软件产品质量,还延缓了软件开发和发布的进度,因此及时地识别和纠正软件缺陷对软件工程实践来说至关
从多种数据中挖掘信息是机器学习的一个重要领域。更具体而言,我们关心的问题称为多模学习,其目标是将物体对象的多样数据信息整合为一种单一表示。尽管过去已经有很多的相关模
无线传感器网络由大量部署在监测区域的传感器节点组成,在军事、医疗、交通、环境等检测领域具有广泛的应用前景。传感器节点具有传感、数据处理和无线通讯功能,彼此之间通过