联机分析处理(OLAP)若干关键技术的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:ie8848
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
联机分析处理(OLAP)是当前数据仓库应用和决策支持系统(DSS)的研究热点.OLAP查询通常需在海量数据上进行即席(ad hoc)的复杂聚集查询,并要求及时向用户提供分析数据,用以辅助决策.这种使用方式对查询响应速度提出了很高的要求,使得提高OLAP查询和分析操作效率成为数据仓库应用中的关键问题.该文是在参与研究和开发一个数据仓库系统(包括数据仓库的建模、ETL、OLAP系统以及应用工具等)的基础上,着重对提高OLAP查询分析效率的ROLAP聚集技术、聚焦Cube、实视图的选择与分割及其增量更新维护等OLAP若干关键技术进行了系统深入的研究.该文的主要研究工作及其所取得的创造性成果有:(1)研究了维层次编码,提出一种基于维层次编码的新型预分组聚集算法DHEPGA.DHEPGA算法充分利用了编码长度较小的维层次编码及其维层次前缀路径,通过维层次编码前缀匹配操作,快速检索出与查询关键字相匹配的维层次编码,求得维层次属性的查询范围,大大减少和简化事实表与维表之间的多表连接,减少了I/O开销,提高了OLAP查询效率.(2)利用Cube中的维层次聚集技术实现高性能的维层次聚集Cube(DHAC).在DHAC中进行数据插入和删除等数据更新时,充分利用维层次聚集树中的维层次前缀,对受到更新影响的所有祖先结点进行增量更新.在插入新维数据时,不需要重新构建聚集Cube就可以对DHAC进行增量更新,从而提高了Cube的更新效率.(3)提出了一种数据仓库实视图选择和分割算法.根据OLAP查询中的选择谓词构造的最小项谓词,选择数据仓库视图进行有效的水平分割和实体化,使OLAP查询通过访问较少元组的分割裂片就可以完成,从而加快了OLAP查询响应时间,削减维护费用,提高了OLAP查询效率.(4)提出了一种数据仓库实视图增量更新维护的有效策略.利用视图表达式树及其计算的中间结果来创建辅助视图,并进行实体化,从而实现数据仓库视图增量更新维护,有效地改善了OLAP查询的数据质量和效率.
其他文献
人脸识别技术是模式识别和机器视觉领域最富挑战性的研究课题之一,它在刑侦破案、证件验证、门禁系统、视频监视等领域中都有广泛的应用前景.该文主要研究静止图像的人脸识别
分布式计算是一种把需要进行大量计算的工程数据分割成小块,由多台计算机分别计算,在上传运算结果后再统一合并得出数据结论的科学.目前已有许多模型,如CORBA,DCOM;RMI;Web S
随着数据库技术的不断发展及其广泛应用,数据库中的数据量急剧增大,当大量数据不停地被收集和存储,业界人士对他们数据中项集之间的相关联系越来越感兴趣。这种数据中项集之间的
随着软件技术和网络技术的发展,基于构件的软件开发正成为当前分布式软件系统开发的主流.相应地,为服务器端构件提供运行时环境的应用服务器的地位和重要性也已经被迅速认可,
本论文针对企业复杂信息系统的集成支持环境及问题进行了分析和研究。本论文在深入讨论和分析了当前比较流行的企业信息系统集成支持技术Web Services和CORBA的基础上,提出了
数据挖掘(Data Mining,DM)和数据库中知识发现(Knowledge Discoveryin Database,KDD)是当今人工智能和数据库等研究领域中活跃的具有广阔应用前景的研究方向.它涉及到人工智
随着Internet的发展,XML越来越被广泛的应用,不仅被用作数据交换的标准,而且用来表示大多数的数据,广泛应用于分布式系统中.在使用XML文档时候,大多都是采用XML DOM的形式,使
目前,移动数据库技术的研究与应用是数据库领域和移动计算领域的一个研究热点,伴随着集成电路技术、移动通信技术等领域的发展,移动数据库产品具有巨大的用户需求。 移动数据
数据挖掘技术是当前计算机技术的研究热点之一,关联规则的研究是近几年研究较多的数据挖掘方法,在数据挖掘的各种方法中应用也最为广泛.较低支持度的项集在传统的关联规则挖