决策信息系统的增量式F-并行属性约简

来源 :湖南大学 | 被引量 : 0次 | 上传用户:huweiguangkaka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是研究不确定、不完整知识的理论方法,它被广泛应用于数据挖掘、人工智能和模式识别等许多领域。属性约简,即在不影响原决策表分类质量的情况下,通过最少的属性来表示决策表的信息,是粗糙集理论研究的核心之一。目前,并行属性约简是粗糙集属性约简研究的热点,它将粗糙集理论从单个信息表或单个决策表推广到多个信息表或决策表,其思想也更符合人类解决问题的思维习惯,也充分体现了粒计算的思想。由于许多优点,并行属性约简得到了许多学者的关注。目前基于决策信息系统的增量式属性约简算法一般采用以下思路:在原决策表中新增加一个对象时,要对这个决策表重新划分新的等价类,为了降低处理增量式数据的复杂度,本文提出了决策信息系统的增量式F-并行属性约简算法。本文主要内容包括四部分:1.对粗糙集理论、F-粗糙集和并行属性约简的相关知识进行介绍。2.在基于F-粗糙集模型和并行属性约简上,本文提出决策信息系统的增量式F-并行属性约简算法。该算法将增加的多行记录组成一个或若干个新的信息系统进行并行计算,能够很好的适应新加入的数据,同时通过利用启发式信息避免了增量式属性约简时间复杂度过高的问题,时间效率提高。3.对基于不确定信息系统的动态属性约简算法和增量式F-并行属性约简算法通过时间复杂度分析从理论上说明了增量式F-并行属性约简算法的可行性和高效性。同时,对五组UCI中的数据集在MATLABR2010a环境下进行实验仿真,对这两种算法进行了对比,得出了如下结论:通过增量式F-并行属性约简算法求得的约简长度在某些数据集上小于基于不确定信息系统的动态属性约简算法求得的约简长度,并且运行时间明显比基于不确定信息系统的动态属性约简算法小,这进一步证明了增量式F-并行属性约简算法的高效性。4.将增量式F-并行属性约简算法应用在医学乳腺肿瘤细胞种类的确定上,使用增量式F-并行属性约简算法对威斯康星乳腺癌数据集进行属性约简与分析,并对乳腺癌患者进行确诊,最终对相应的决策规则进行提取。最后,根据决策属性值分析了患有乳腺癌人群的发病特点与乳腺癌的确诊之间的关系。
其他文献
3月2日上午,省纪委监委理论学习中心组举行专题学习会,学习习近平总书记在党史学习教育动员大会上的重要讲话精神,省委常委、省纪委书记、省监委主任王拥军主持并讲话。他强
由于地质特征的独特性和复杂性,东濮凹陷形成了复杂的沉积体系,其中以三角洲沉积最为发育,包括正常三角洲、扇三角洲和辫状河三角洲三种沉积相,不同三角洲的形成条件和沉积特
纸是人类生活不可或缺的物品,现代造纸对造纸装备和技术要求高,资源消耗大,污染防治任务重。受国内包装生产条件的限制,目前造纸企业的纸卷包装大部分以人工安装内封头、放置外封头和贴商标为主,人工进行以上操作不仅使得包装效率低、难以保证包装效果的一致性和包装质量,而且由于包装厂内环境较差,包装设备危险性大等严重危害工人的健康,所以使用工业机器人替代人工对纸卷进行包装越来越受到造纸企业的关注。本课题设计了一
搜索引擎是在互联网上海量的信息中检索到所需信息的重要途径。但是,不同的搜索引擎所采用的算法以及搜索范围并不相同,致使对于同样的关键字,不同的搜索引擎通常返回不同质
财务共享服务中心(Financial Shared Service Center,FSSC)的理念根源最初可以上溯至上世纪60年代,IBM提供的信息技术外包服务使得人们逐渐意识到在高度分工的未来社会中将职能从单一业务中剥离进而集中处理、统一核算的可能性。自1981年福特公司设立第一家专注于财务审计职能的共享服务中心后,财务共享服务模式的概念迅速普及发展。对于大型企业而言,出于财务优化、管理优化的目
水体有机物污染是全世界普遍存在的环境问题,危及生态系统功能和人类健康。基于纳米复合材料的高效、低能耗、深度催化氧化降解水体有机污染物技术已成为环境科学与工程、材
随着神经网络的发展,图像文字检测识别在医疗等领域都发挥了重要的作用。目前对英文识别的研究已经有很多,但针对维吾尔文的图像文字识别、检测的相关研究和应用比较少。针对目前没有公开用于识别的维吾尔文图像数据集的问题,本文构建了一套关于维吾尔文扫描体识别的数据集,其中训练集包含10万张合成图像和7395张真实图像,验证集和测试集分别包含991张真实图像数据,该数据集对于之后相关的实验研究将有积极的推进作用
随着大数据信息时代的不断发展,人们对获得信息以及信息传输的速度和质量提出了更高的要求。传统的多输入多输出系统(Multiple-Input Multiple-Output,MIMO)难以满足信息高速传输需求,大规模MIMO系统通过布设大量天线充分挖掘空间资源,能够在不消耗额外频谱资源的条件下提供更多的复用增益,进而提高系统容量。在实际通信系统中,具有大量天线数的大规模MIMO系统如果仍然以传统的方
2016年中央农办领导前往“无锡田园东方”田园综合体项目考察后,给予其模式高度认可。并将集循环农业、创意农业、农事体验于一体的田园综合体模式作为乡村新型产业发展的亮点措施写入2017年中央一号文件。随着“田园综合体”概念的提出,乡村景观迎来了高速化的发展。而随着建设的不断推进,田园综合体的诸多问题也被一一暴露出来。例如产业单一、技术短缺、带动能力有限等。其背后原因是多方面的,但从设计的角度来说,其
随着城镇化进程的不断加快,不可避免的扰乱区域生态景观安全,人口、资源与环境问题日趋严重。长株潭城市群是湖南省城镇化建设的引导区,是全国两型社会建设的实验区,其区域城