【摘 要】
:
本课题以飞跃汽车百货连锁销售服务公司为研究背景,依据公司决策层的需求,分析和设计了适合公司决策支持的数据仓库逻辑模型和物理结构,并对数据抽取、转换、装载(ETL)和数据
论文部分内容阅读
本课题以飞跃汽车百货连锁销售服务公司为研究背景,依据公司决策层的需求,分析和设计了适合公司决策支持的数据仓库逻辑模型和物理结构,并对数据抽取、转换、装载(ETL)和数据清洗等技术进行了具体地应用实践探讨,最终设计并实现了可满足决策分析报表所需的数据仓库及其相关的ETL工具。本论文的主要研究内容和成果概述如下:首先,在调研该企业的组织机构、管理流程和业务系统现状的基础上,分析和设计了适合公司决策支持所需要的数据仓库的八大主题,即VIP客户主题、采购主题、服务主题、库存商品主题、商品毛利主题、销售主题、应付款主题和应收款主题。采用星型模型和雪花模型相结合的方式,建立了八大主题的逻辑模型和物理模型。根据公司的财力和投资情况,在操作数据存储(ODS)环境下实现了数据仓库。其次,设计并实现了一个基于XML半结构化数据的ETL工具。本文运用DOM对象分析XML数据源,从企业实际出发设计并实现了半结构化数据的ETL工具,从而解决了公司财务软件系统的对外输出接口导出的XML半结构化数据加载到数据仓库中的难题,同时也解决了商用ETL工具不能直接抽取并加载XML文档到数据仓库的弊端,满足了企业的实际需要。然后,设计并实现了一个结构化数据的ETL工具。在该公司的现行业务系统中,大多数的数据都是基于SQL SERVER 2000和ORACLE 9i的结构化数据,通过结构化数据ETL工具的设计与实现,为用户预留自定义数据清洗函数接口,弥补了商品化ETL工具清洗函数不可扩展性的不足。另外,在支持ETL工具运行的元数据中保留了数据提取的SQL文本,减少了同类SQL再次执行时重新编译带来的时间开销。通过实验,验证了本文的研究成果是可行的。最后,对数据仓库优化技术进行了探讨。
其他文献
自20世纪80年代末出以来,GUI广泛应用在各种软件系统中,如电脑操作平台、手机软件系统以及互联网站等。GUI已经成为现代软件中实现交互的一种重要方式,因此GUI测试也成为系统测
随着经济社会的发展,人们对于旅游的需求越来越旺盛,旅游产业迎来了快速发展。各种旅游信息呈爆发式增长,如何方便快捷的从这些信息中获取有用信息变得越来越困难。当人们将
为了有效地利用Deep Web中丰富的、高质量的信息资源,建立Deep Web数据集成系统成为当前研究的迫切需求。Deep Web接口的发现与抽取是构成集成系统的基础,占有重要的地位。本
随着软件的在关键领域如电子商务、银行、航空等的广泛应用,其可信性已经越来越多的获得人们的关注,据报道,2000年到2006年基于WEB的攻击从25%上涨到61%。然而,目前的软件工
笔者硕士论文的研究工作是在对路由器(交换机)和通信子网进行性能测试与评价的背景下进行的,本论文涉及分布式协同多点并发测试系统的图形化描述工具。ISO9646为测试网络中继
Web上的信息根据深度可以划分为两大类:Deep Web和Surface Web。Deep Web中的信息比Surface Web中的信息质量更高、信息量更大,为了有效地利用这些信息,需要建立Deep Web数据
小肠运动性的定量评价可以揭示小肠运动机能的重要信息,在医学研究和临床应用方面意义重大。基于MRI(核磁共振成像)技术的小肠运动性定量评价通常需要人工检测小肠片段的轮廓
随着计算机软硬件、人工智能技术的不断发展,以及各种智能电子设备和社交网站的流行与普及,人们在工作、生活、学习、社交和娱乐中产生了海量的数字图像,如何能够在互联网环
微波通信是指利用微波(射频)携带数字信息,通过电波空间,同时传输若干相互无关的信息,并进行再生中继的一种通信方式。微波通信传输网在运营过程中会产生各种设备故障和通信
在关于下一代网络的研究工作中,四川省网络通信重点实验室针对Internet面临的高速交换、服务质量保障、安全性和移动性等问题,提出了单物理层用户数据交换平台体系结构网络SU