论文部分内容阅读
联机分析处理(OLAP)是当前数据仓库应用和决策支持系统(DSS)的研究热点.OLAP查询通常需在海量数据上进行即席(ad hoc)的复杂聚集查询,并要求及时向用户提供分析数据,用以辅助决策.这种使用方式对查询响应速度提出了很高的要求,使得提高OLAP查询和分析操作效率成为数据仓库应用中的关键问题.该文是在参与研究和开发一个数据仓库系统(包括数据仓库的建模、ETL、OLAP系统以及应用工具等)的基础上,着重对提高OLAP查询分析效率的ROLAP聚集技术、聚焦Cube、实视图的选择与分割及其增量更新维护等OLAP若干关键技术进行了系统深入的研究.该文的主要研究工作及其所取得的创造性成果有:(1)研究了维层次编码,提出一种基于维层次编码的新型预分组聚集算法DHEPGA.DHEPGA算法充分利用了编码长度较小的维层次编码及其维层次前缀路径,通过维层次编码前缀匹配操作,快速检索出与查询关键字相匹配的维层次编码,求得维层次属性的查询范围,大大减少和简化事实表与维表之间的多表连接,减少了I/O开销,提高了OLAP查询效率.(2)利用Cube中的维层次聚集技术实现高性能的维层次聚集Cube(DHAC).在DHAC中进行数据插入和删除等数据更新时,充分利用维层次聚集树中的维层次前缀,对受到更新影响的所有祖先结点进行增量更新.在插入新维数据时,不需要重新构建聚集Cube就可以对DHAC进行增量更新,从而提高了Cube的更新效率.(3)提出了一种数据仓库实视图选择和分割算法.根据OLAP查询中的选择谓词构造的最小项谓词,选择数据仓库视图进行有效的水平分割和实体化,使OLAP查询通过访问较少元组的分割裂片就可以完成,从而加快了OLAP查询响应时间,削减维护费用,提高了OLAP查询效率.(4)提出了一种数据仓库实视图增量更新维护的有效策略.利用视图表达式树及其计算的中间结果来创建辅助视图,并进行实体化,从而实现数据仓库视图增量更新维护,有效地改善了OLAP查询的数据质量和效率.