论文部分内容阅读
近年来,随着信息技术的高速发展,OLAP(On-Line Analytical Processing)技术逐渐成为人们研究的重点。关系数据库具有二十多年的发展历史,在技术上已经相当成熟并形成国际标准。因此,OLAP与关系数据库相结合而形成的ROLAP(Relational OLAP)解决方案必将具有广阔的发展前景。 对于基于关系数据库的ROLAP,加速OLAP查询最常用的一种方法是使用物化视图。但该方法存在一种缺陷,即索引及视图在存储量和计算量上的高代价。为了解决这一问题,技术人员进行了广泛的研究,提出了一些解决方案。在这些方案中,视图物化的工作是按照先选择物化视图后建立索引的顺序进行的。优化工作主要集中在物化视图的筛选或索引的筛选工作上,但是,绝大多数的研究工作中仅仅对其中的某一个方面进行优化。将物化视图及索引的可用空间分开考虑,使得优化工作的执行效率很低,因为物化视图及索引同时消耗同样的系统资源——存储空间。 基于上述原因,本文提出,对视图物化工作进行优化时,应将对索引的筛选与对物化视图的筛选作为一个整体来进行,并且物化视图的选择和创建可以以索引筛选结果为依据。本文认为对于主键的属性集合,如果在其子集上建立的索引能够满足查询要求,那么就只针对该属性子集建立索引。根据该观点,本文提出了一个索引筛选算法,即基于“主优势属性集”的索引选择策略(PFS,Primary DPrime Filtration Strategy),通过该算法可以在获得满意的候选索引的同时,尽量减少对数据库的查询次数,从而实现对索引筛选工作的优化。另外,本文认为可以根据过滤出的非唯一索引,将索引属性值相同的元组聚合成为一个超级元组。然后采用Nest_Table数据结构来组织这个超级元组,通过这种嵌套关系,可以重新组织视图的结构,从而完成视图的物化工作。 本文所提出的索引选择及视图物化的方法都已经在山东大学自主研发的CDTP系统中进行了测试,并取得了满意的执行效果。 在本文的最后,对全文内容进行了总结,对ROLAP技术的发展进行了展望,并且指出了下一步应进行的工作。