粗糙集属性约简算法在数据挖掘中的研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:gx008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库的不断增长,自动从数据库中获取有用的知识成为人们日益迫切的需要.粗糙集理论(Rough Sets)就是在这样背景下不断发展起来的一种用于不精确、不确定数据挖掘与处理的新型数学理论.粗糙集理论也凭借其独特的优势而在KDD领域中具有越来越重要的地位.属性约简是粗糙集理论研究的核心问题之一,本文首先介绍了Pawlak粗糙集模型以及决策表、可辨识矩阵和约简等基本概念,为后面章节中的属性约简算法打下了理论基础.现已证明,寻找一个决策表的最小约简是NP-难问题,在人工智能中,解决这类问题的方法一般是使用启发式算法.本文把属性重要性作为启发式信息,以核属性为寻求约简的起点,通过对算法中加入启发式信息,减少了搜索空间.给出了相对可辨识矩阵的概念,并以相对可辨识矩阵为基础,对属性约简的基本算法做出了改进,把本来是对可辨识矩阵进行逻辑运算的计算转化成代数运算,在一定程度上简化了计算,提高了约简效率.后面又提到了基于信息熵的相对属性约简算法.并在文章的最后提出了一种新的基于灰色关联度的属性约简算法,实验证明,该算法可以获得令人满意的约简.
其他文献
期刊
期刊
统计学习方法,特别是Boosting学习,在计算机视觉中得到广泛的应用。本文研究基于Boosting自动人脸识别算法。在理论上,本文提出一种改进的Boosting学习算法;在实践上,本文将Boosti
期刊
期刊
随着科学技术的发展和社会的进步,我国科普教育事业得到了长足的发展,提高全民科学素质,普及青少年的科普教育,提高民族自主创新能力已经成为我国国家发展的核心战略。单一的
期刊