数据仓库、OLAP及数据挖掘技术的研究与设计

来源 :同济大学经济与管理学院 同济大学 | 被引量 : 0次 | 上传用户:ZF6VE5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国办公自动化的理论经历了由文档型、综合型OA上升到决策型OA的 过程,决策型OA是以领导决策为核心,运用了国内外最新的研究技术—数据 仓库、OLAP(联机分析处理)和数据挖掘,提供给企业和政府机关的领导全 方位、多视角的分析本单位的信息,把单位的发展决策建立在量化的信息整合、 展现和预测基础上。 本文从一个实际的企业综合信息系统开始,介绍了数据仓库的概念、特征 以及与传统数据库的区别,讲述了构建数据仓库的具体步骤;给出了OLAP与 OLTP的差异,OLAP的评价准则,OLAP的几个概念:维、立方体、切片、切 块和旋转等,进而论述了OLAP的设计模式及立方体的数学模型;在第三章介 绍了数据仓库和OLAP在实际项目中的设计与实现。 本文后半部分重点阐述了数据挖掘技术的概念、方法和技术,介绍了国外 用于数据挖掘技术的流行算法--C4.5的基本思想,指出了其中的不足之处,给 出了改进技术—如何剪枝,同时剖析了作者所在项目组完成的一个数据挖掘工 具—INFOMAN的数据结构;在深入分析C4.5算法本质的基础上,又进一步提 出了利用信道容量来进行数据挖掘工作,分析了此算法的优点和不足之处。第 四章讲述了如何利用规则生成算法构建数据挖掘,在引入了通用规则算法的基 础上,给出了一个关联规则的数学模型。 本文阐述了设计数据挖掘的多种技术和方法,实际上每一种算法都有其适 用方面,有其优点和不足,并不能武断地认为一种算法一定比另一种算法好。 因此,在设计DM时,要优选合适算法,例如我们开发的项目的源数据类型就 适宜用C4.5决策树算法和规则生成算法来挖掘,而最近我们设计的某区交通决 策信息系统的源数据类型则适宜用神经元或蚁群算法来挖掘。 关键词:决策型OA、OLAP、决策树、熵、元数据、数据集市、剪枝
其他文献
该文在系统综述高新技术及其产业概念、高新技术发展理论的有关研究成果基础上,进行了如下研究:第一,从科学技术与经济的基本关系入手,对高新技术产业发展历程、产业化系统、
颗粒物捕集器技术首次应用到港口疏浚监测中,通过对现场疏浚悬浮颗粒物的监测以及对生物的急性半致死浓度的模拟实验研究,建立了一套较完整的疏浚监测系统和技术,可以更有效
该文首先介绍了物流概念、物流系统,再从物流中心的概念入手对企业物流中心的功能、类型进行了介绍,然后结合企业物流系统和管理信息系统的原理,运用最新的面向对象分析、设
一、地膜棉花的叶片分化特点棉花主茎叶片从生长点突起到新生叶展平可分为四个分化时期。(1)叶原基突起。生长点边缘发生小突起,一般棉株为2个。(2)叶原基分化(分化叶)。叶
第一章探讨现代企业生产系统.首先,讨论了生产系统的概念,并给出了生产系统的一种定义;其次,从信息流和物流的角度分析了生产系统的基本构成及构成上的特征;第三,讨论了跨国
“你是晚报总机吗?我们这里下了冰雹,我想用电话发个稿,请给接编辑部。”“编辑部的人下班了,不过不要紧,他们备有录音机,等我接通后你就念稿吧!”羊城晚报想得真是周到!这
该文以现代决策理论、系统工程和运筹学等管理定量化方法作为系统管理模型设计的理论基石;以软件工程中的自顶向下、逐步求精、逐步分解的结构化思想作为系统分析与系统设计
中共西安市委宣传部最近召开了厂报工作者的座談会。会議着重討論了如何提高厂报质量的問题。会議检查了目前厂报中的主要問题。比較普遍的現象是,許多消息只是单純地报道生
全文共分五章.第一章分析了该课题研究的现实意义,综述了该领域国内外研究现状.第二章提出了工序控制单元的基本概念、提出并阐述了面向工序控制单元的施工项目管理流程和组
随着社会的发展和生活水平的提高,人们对产品质量安全问题越来越关注。产品的生产和消费日益分离,人们对其所消费产品的质量信息获取日益迫切。质量追溯作为企业产品质量保证