论文部分内容阅读
知识发现(KDD,Knowledge Discovery in Database)是从数据中获取知识的一种智能信息处理技术。分类是数据挖掘的重要组成部分,它根据类标号已知的数据建立模型,进而使用该模型来预测类标号未知的数据所属的类。粒度计算的思想产生于20世纪70年代,它的基本思想是模仿人类思考问题的方式:即人们能从极不相同的粒度上观察和分析同一问题,而且能够很快地从一个粒度世界跳到另一个粒度世界,往返自如,毫无困难。近年来,人们开始将粒度计算应用到数据挖掘领域中,并初步取得了一些成果,成为当前数据挖掘领域一个新的研究方向。本文的主要工作是将粒度计算引入数据分类中,做了一些相关的研究,主要的研究内容包括:1、本文较全面和深入地探讨了数据分类问题,讨论了分类的内涵(分类器构造)、外延(特征选择和规则提取)和本质,并针对数据分类问题的难点,研究了分类器构造的粒度变换与计算问题。2、本文探讨了分类算法的粒度原理,利用粒度计算理论,独立于具体算法,展开对基于粒度计算理论的数据分类建模的研究,以探讨信息系统中知识形成的一般性规律和内在机制。3、研究了不完备信息系统的分类问题。根据人的认知规律,即人类可以利用有限的知识,在较浅层次上获取比较满意的结果,避免了知识深层次上的不完备性的特点。利用商空间粒度计算理论和Rouggh Set相结合的办法,对缺省属性样本进行投影和粗粒度处理,使得投影后的系统成为决策一致性系统。这样尽可能利用现有已知样本,采用多层次的处理方法解决了不完备信息系统的分类问题,克服了现有大多数算法只能应用于完备信息系统的分类问题,扩大了分类器的应用范围。本文的创新点主要表现在:1、定义了集合的粒度表示,导出一个基于粒度计算理论的数据分类建模。2、将粒度计算模型和Rough set相结合应用于解决不完备信息系统的分类问题。