基于粒度计算的分类方法研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:liqi1987712
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识发现(KDD,Knowledge Discovery in Database)是从数据中获取知识的一种智能信息处理技术。分类是数据挖掘的重要组成部分,它根据类标号已知的数据建立模型,进而使用该模型来预测类标号未知的数据所属的类。粒度计算的思想产生于20世纪70年代,它的基本思想是模仿人类思考问题的方式:即人们能从极不相同的粒度上观察和分析同一问题,而且能够很快地从一个粒度世界跳到另一个粒度世界,往返自如,毫无困难。近年来,人们开始将粒度计算应用到数据挖掘领域中,并初步取得了一些成果,成为当前数据挖掘领域一个新的研究方向。本文的主要工作是将粒度计算引入数据分类中,做了一些相关的研究,主要的研究内容包括:1、本文较全面和深入地探讨了数据分类问题,讨论了分类的内涵(分类器构造)、外延(特征选择和规则提取)和本质,并针对数据分类问题的难点,研究了分类器构造的粒度变换与计算问题。2、本文探讨了分类算法的粒度原理,利用粒度计算理论,独立于具体算法,展开对基于粒度计算理论的数据分类建模的研究,以探讨信息系统中知识形成的一般性规律和内在机制。3、研究了不完备信息系统的分类问题。根据人的认知规律,即人类可以利用有限的知识,在较浅层次上获取比较满意的结果,避免了知识深层次上的不完备性的特点。利用商空间粒度计算理论和Rouggh Set相结合的办法,对缺省属性样本进行投影和粗粒度处理,使得投影后的系统成为决策一致性系统。这样尽可能利用现有已知样本,采用多层次的处理方法解决了不完备信息系统的分类问题,克服了现有大多数算法只能应用于完备信息系统的分类问题,扩大了分类器的应用范围。本文的创新点主要表现在:1、定义了集合的粒度表示,导出一个基于粒度计算理论的数据分类建模。2、将粒度计算模型和Rough set相结合应用于解决不完备信息系统的分类问题。
其他文献
在企业信息化建设过程中,各个部门往往根据自身的信息要求和特定的应用系统需求而采用了不同的数据组织模式从而构建了各种异构的数据源。这些独立数据源并不一定遵守一致的
Web服务是新形式的因特网软件,它统一使用因特网协议布置和调用,来自不同服务商的服务被整合以提供一个组合服务。随着Web服务技术日新月异的发展,服务提供者之间竞争的加剧,
21世纪是信息时代,也是网络时代。随着信息科学的进步和因特网的普及,网络信息资源越来越丰富,网上信息呈爆炸式增长。这一方面给用户发现信息、利用信息带来了方便,另一方面
随着微小卫星的发展和应用,微小卫星对微推进系统的需求越来越迫切,要求也越来越高,本文对在微小卫星上应用激光推进技术进行了建模,并在此建模基础上设计了一个激光推进微小卫星
随着互联网和移动互联网的发展,智能移动终端的普及,以互联网、手机、手持阅读器等移动媒体为依托的出版模式已呈现良好的发展势头,同时以纸质媒体为代表的传统图书出版仍然在出
迁移工作流(migrating workflow)是近年工作流管理研究的一个新方向。基于移动计算范型的迁移工作流系统包括工作流引擎、迁移实例和工作位置三个要素。工作流引擎完成工作流
中国教育科研网格公共支撑平台(CGSP)是为了构建ChinaGrid而研发的核心网格中间件。CGSP由一组互相配合的软件组件组成,支持ChinaGrid网格应用的开发、调试、部署、运行管理以
随着企业信息化的发展,对计算机和信息系统的依赖越来越强。企业扩大,业务增多,应用系统越来越多。员工在使用这些系统过程中,必然要经过无数次的登录与认证,大大降低了工作
随着多媒体在高速网络的广泛应用,多播路由问题(Multiple DestinationRouting)已成为越来越重要的研究课题。多播路由问题可以数学上形式化成Steiner树问题,该问题的求解是需要
随着网络技术的不断发展,Web地理信息系统(WebGIS)已经成为地理信息系统(GIS)的研究热点,它为发布及使用地理信息空间数据提供了一种便捷途径。本课题在研究数字林业及WebGIS