基于粗糙集理论在数据挖掘中的研究与应用

来源 :贵州大学 | 被引量 : 4次 | 上传用户:chen90245
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库的不断增长,自动从数据库中获取有用的知识成为人们日益迫切的需要。粗糙集理论(Rough Sets)就是在这样背景下不断发展起来的一种用于不精确、不确定数据挖掘与处理的新型数学理论。粗糙集理论也凭借其独特的优势而在KDD领域中具有越来越重要的地位。波兰数学家Z.Pawlak于1982年提出的粗糙集理论是一种新的处理模糊和不确定性知识的数学工具。能有效地分析与处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。粗糙集在机器学习、知识获取、决策分析、过程控制等许多领域都得到了广泛的应用。数据挖掘(Data Mining,DM)是从存放在数据库、数据仓库或其它信息库中的大量数据中挖掘有趣知识的过程。许多数据挖掘技术仅仅适用于精确集,不适用于粗糙集,而现实中粗糙集是普遍存在的现象,其最大特点是提供问题所需处理的数据集合之外的任何先验信息,可直接从给定问题出发,达到实现“让数据指导行动”的思想,因此基于粗糙集的数据挖掘模型在信息系统的研究领域具有重要意义。本文结合数据挖掘与粗糙集理论的知识,尤其是属性约简知识。给出了2008年我国北京奥运会部分运动员获奖情况用粗糙集知识进行的例证;提出了基于粗糙集的数据挖掘模型;借助湖南省大中专院校招生就业信息系统,以现在大学生就业为例,用粗糙集理论说明了当今的大学生就业中其转变就业观念是很重要的。
其他文献
在物联网与移动互联网不断发展的今天,人们对室内定位导航的需求不断增加,室内定位问题也得到越来越多的研究。由于室内无线局域网(WLAN)的普及与完善,基于WLAN的位置指纹定
在过去几年里,Internet的资源迅速增长,使web发展成为包含多种信息资源,站点遍布全球信息服务网络。在这样的大环境下,网络上出现了很多商业性的web搜索引擎,如Google、百度
随着社会的发展,生产力的提高,对企业的生产效率要求越来越高,并且大规模的车间生产已经逐渐成为制造业的主流。研究批量车间调度的优化方法,对于制造业的现代化建设以及指导
在计算机动画模拟领域中,对不规则模糊物体的模拟是一项困难而又有意义的课题。  本文主要对烟花、烟雾两种不规则模糊物体进行了模拟。针对烟花粒子的运动规律,我们采用了
本文研究了基于XSBase255开发平台的嵌入式系统软件设计的关键技术,分析了开发平台的相关模块,搭建了宿主机开发环境,探讨了BootLoader技术,完成了Linux内核的定制,设计了相
据统计,在85%的信息系统中存在着与地理位置有关的信息,在这些信息中,既有空间信息,也有大量以传统数据库表达的非空间信息。随着计算机技术的出现和广泛应用,地图学家认识到
本文围绕构建LCD控制器系统级模型及其验证过程展开研究。首先,在介绍LCD控制器概念的基础上,分析了LCD控制器工作原理以及S3C2410 LCD控制器的工作机制,详细规划了LCD控制器
根据学生自身的情况进行差异化教育和多元化教育一直是教育领域中的理想模式,随着计算机软件的发展,交互式辅助教学系统就是通过这种方式在减轻教师负担的同时又提高了学生的
伴随着信息社会的不断进步和发展,信息安全已经成为了一个突出问题,通信安全作为信息安全的最重要部分之一,也受到了广泛的关注。传统的通信安全是通过传统密码的计算复杂性
随着计算机技术的飞速发展,国际医学信息标准化、电子化的推进,利用计算机进行医院病历现代化管理已是时代发展的必然趋势。在医院的现代化管理中,电子病历EMR(Electronic Me