论文部分内容阅读
联机分析处理(OLAP)是当前数据仓库应用和决策支持系统(DSS)的研究热点。OLAP查询通常需在海量数据上进行聚集查询,并要求及时向用户提供分析数据,用以辅助决策。这种使用方式对查询响应速度提出了很高的要求,使得提高OLAP查询和数据更新效率成为数据仓库应用中的关键问题。本文在对国内外OLAP的理论研究和应用现状进行了广泛了解和深入分析的基础上,对OLAP技术作了以下一些探索和研究。首先对OLAP技术的基础理论进行了综合分析,讨论了它的概念、结构、特征、数据组织方式以及OLAP系统需要满足的基本要求。其次,对当前多种常用的OLAP数据立方体存储结构的特点、实现方式及其综合性能进行了分析。虽然它们使得OLAP系统的性能有了一定程度的提高,但是仍然达不到实际应用查询和更新速度的要求。目前在关系型OLAP(ROLAP)中,层次聚类理论的应用技术已经比较成熟,且取得了一定的成效,使得ROLAP系统的综合性能有了大幅度的提高。为此本文将层次聚类理论应用于Cube存储结构,构建了基于维层次聚类的Cube存储结构(DHC-Cube)。将基于维层次聚类的Cube存储结构与传统的Cube存储结构进行了对比。分析表明DHC-Cube改善了数据更新和查询的速度,不失为是一种有效的结构。最后,将维层次聚类的相关技术应用于实际项目中,并取得一定的效果。