【摘 要】
:
海量数据聚集算法是在线联机分析处理(Online Analytical Processing,简称OLAP)的核心问题。OLAP旨在处理涉及到商业智能的数据,这是一类非常重要而又异常复杂的问题。OLAP利
论文部分内容阅读
海量数据聚集算法是在线联机分析处理(Online Analytical Processing,简称OLAP)的核心问题。OLAP旨在处理涉及到商业智能的数据,这是一类非常重要而又异常复杂的问题。OLAP利用聚集算法产生的N维数据模型(数据立方体)可以在极短的时间内响应查询;同时带有复杂条件约束的范围聚集查询(多维范围查询)随着商业智能的发展显得越发重要。随着计算机技术发展,查询变得更加复杂、立方体维度不断上升、数据规模持续扩大,这些新情况给OLAP带来了严峻的挑战,海量数据聚集所需的计算时间成为了严重制约OLAP系统性能的瓶颈。CUDA是由NVIDIA所推出的一种集成技术,将图形处理器(Graphic Processing Unit,简称GPU)引入高性能计算领域。同传统CPU相比,GPU拥有更高的计算能力和内部带宽,于是如何利用GPU设计新的聚集算法成为OLAP计算领域中一个新的热点。针对利用GPU解决OLAP聚集问题,本文主要研究内容如下:(1)分析了经典的CPU算法和新近提出的GPU算法之间的区别及各自优缺点,总结了影响聚集效率的主要因素;(2)提出了一种面向并行聚集的多维前序树(Multi-dimensional Prefix Tree)存储模型,可以依据前序编码(Prefix Encoding)分割数据空间,对原始数据进行压缩和存储;提出了多维前序树并行构造算法,并通过实验证明了其相对数据库有6倍的加速比;(3)基于多维前序树模型,面向GPU构架,提出了一种并行的面向海量数据的选择及聚集算法,可以快速应答带有复杂条件约束的聚集查询,最后通过对比实验证明了其相对数据库有6倍的加速比,对比同类GPU算法也有1.3倍的加速比。
其他文献
随着卫星技术和计算机技术的飞速发展,数字遥感卫星影像已经在各行各业中发挥着越来越大的作用。但是遥感卫星影像在实际应用前必须经过预处理,而目前的处理方法还存在着很多
作为一种特殊的分布式计算框架,网格的动态、异构、多域等特性决定了网格安全的重要性。网格安全主要是解决实体之间的认证和授权问题。Globus项目中的安全基础设施GSI(Grid
Internet中存在着大量的化学信息资源,在这些海量信息面前,用户要查找自己需要的信息,必须要借助于搜索引擎。目前,很多化学结构信息采用了系统命名法、线性码等方法进行描述
伴随着计算机网络技术和多媒体技术的飞速发展,多媒体数据逐渐成为人们获取信息的重要来源,并成为人们生活的重要组成部分。随之而来的副作用是有恶意的个人或团体有可能在没
随着多媒体技术和网络技术的日趋成熟,在互联网发展内在需求的驱动下,作为两者交叉领域的流媒体技术的应用和研究也取得了长足的进步。多媒体数据量大,对网络带宽要求很高。
近年来,基于P2P网络的资源共享技术发展迅速,P2P数据库是该领域的一个重要研究方向。P2P数据库内容认证,即判断数据库内容是否被篡改,是成功构建P2P数据库系统的关键之一。通
语义推理技术是自然语言处理中的一项基础而重要的技术,能够帮助我们更好地理解文章的内容及上下文的语义推理关系。语义推理一般分为论据和论点两部分,论据是从文章内容中提
近年来,随着信息技术的飞速发展,移动通讯与互联网的融合日趋明显,作为电子商务领域的新生力量——移动商务,开始成为传统电子商务的有益补充,显示出巨大的发展潜力和成长空间。移
当前,我们处在一个瞬息万变的互联网时代。近几年来,以SNS、微博、微信等为代表的新型网络社交工具迅速崛起,各自拥有了数量巨大的用户群体。微博凭借着实时性强,内容简练(14
随着流媒体技术的发展,人们对路由的服务质量(QoS,Quality of Service)提出了更为严格的要求,其中包含对诸如带宽、延迟、延迟抖动、代价等综合因素的考虑。如何在满足QoS要