基于图形处理器的高速并行算法研究

被引量 : 0次 | 上传用户：zzmaazhu

【摘要】

：

最早为图形渲染而专门设计的图形处理器(GPU),因其越来越强大的浮点运算能力和大规模并行处理能力,时至今日在通用计算领域也得到了广泛的应用,并且在科学计算领域获得了极大

【作者】

：

祖渊

【发表日期】

：

2014年期

【关键词】

：

正则表达式匹配非确定性有限状态自动机无损数据压缩 LZSS 哈夫曼编码 Deflate 统一计算架构图形处理器

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

最早为图形渲染而专门设计的图形处理器(GPU),因其越来越强大的浮点运算能力和大规模并行处理能力,时至今日在通用计算领域也得到了广泛的应用,并且在科学计算领域获得了极大成功。GPU通用计算已成为当前工业界和学术界的研究热点。面对急剧增长的网络流量和包处理复杂度,网络设备面临越来越大的计算压力,利用GPU提高网络设备的处理能力成为GPU通用计算又一个新的应用领域。然而与科学计算领域以计算密集型问题为主、数据并行性易于利用不同,网络计算领域以访存密集型和I/O密集型任务为主,且数据并行性难以挖掘和利用。将GPU应用于网络处理领域需对既有算法进行并行化再设计,使之适应GPU的体系结构,以充分利用GPU的大规模并行计算能力。本论文选择正则表达式匹配和数据无损压缩两个尚未有效解决的问题,研究它们在GPU上的高效实现方法。正则表达式匹配无论是用硬件还是软件、在CPU上还是在GPU上实现,都面临难以调和的时空两难问题。基于DFA的正则表达式匹配速度快,但存在空间爆炸的问题；基于NFA的正则表达式匹配空间复杂度低,但匹配速度也慢。论文在深入研究GPU架构特点及NFA特征的基础上,提出一种高效的NFA实现方法。无损数据压缩无论是采用基于字典的压缩技术还是基于统计的压缩技术,数据压缩操作的数据间依赖性都很强,数据并行性难以挖掘和利用,GPU特有的单指令流多数据流并行执行模式又进一步增加了并行化的难度。论文研究以上两种压缩技术的代表性算法-基于字典的LZSS压缩算法和基于统计的哈夫曼编码算法在GPU上的高效实现,并在此基础上完成了基于这两种技术的Deflate数据压缩算法的并行化。论文的主要贡献和创新点如下：1针对正则表达式匹配的时空两难问题,论文以空间复杂度最低的NFA作为正则表达式匹配的基础实现,通过引入状态兼容组、兼容超级组、虚拟NFA状态等概念优化线程的任务分配,并通过数据包交织存储、全局存储器归并访问等技术提高线程的访存效率,实现了正则表达式匹配在GPU上的高效实现。该工作首次解决了正则表达式匹配的时空两难问题,在获得10Gbps匹配速度的同时仍然保持算法的线性空间复杂度。2针对基于字典的无损数据压缩算法LZSS在GPU上并行化程度低的问题,本文以哈希表作为字典的基础实现,通过精巧的数据结构及算法设计有效解决了并行化LZSS算法中最困难的线程串行化问题,并显著减少了对GPU计算资源的使用。该项工作在压缩率和压缩速率两个方面都明显优于目前在GPU上加速LZSS算法的最好工作。3本文在Deflate无损数据压缩算法的上下文中研究哈夫曼编码算法在GPU上的并行化,通过精巧的算法设计和CUDA原子操作有效解决了直方图计算、哈夫曼树构建和变长编码的并行化问题。该工作系首次在GPU上完成了Deflate算法的并行化实现,在压缩率接近Deflate算法的同时,压缩速率超过四核CPU上的Deflate算法实现。本文工作在高效实现正则表达式匹配和无损数据压缩在GPU上并行化的同时,也为其它算法在GPU上的高效实现提供了方法性指导及技术参考。

其他文献

奢侈品电商再起波澜

<正>坏消息的传播速度就是这么惊人,而这一次舆论再次剑指奢侈品电商。事件缘起一则题为《暗访电商假货链条》的报道,经过半个月的暗访,曝光了供应商"鹏恒业"通过聚美优品、

期刊

奢侈品聚美优品

关键路径法在信息系统进度管理中的应用

进度管理是项目管理中一个重要的环节,关键路径方法是其中最常用的方法之一。本文结合实例重点介绍了当项目中每个活动的之前活动、所需时间和所需工作量都已经确定,那么关键

期刊

进度管理进度计划关键路径

简帛医籍的发现与整理

中医古籍的主要形式是简册和帛书,世称"简帛医籍。"近百年来,随着考古学的发展,大量涉及中医的简帛不断地被发现,这对于重修医学史与校勘古医籍具有其他文献无法替代的重要作

期刊

出土简帛医籍

泰勒公式在高考命题中的地位(上)

<正>本文试图从导数命题的类型之一,探讨解决导数问题的思想方法,主要从"高等数学情景的初等化"谈起。一、泰勒展开式原型泰勒展开式很好地把初等函数形式与超越函数联系起来

期刊

高考命题泰勒公式恒成立不等式

新闻报道与“多彩贵州风”文化产业效应

通过对贵州文化产业的重头产品“多彩贵州风”媒体战略的梳理和解读,试图印证媒介以及媒介技术对文化产业的巨大推动作用,突出、强调文化产业与现代媒体的有效联动会带来巨大

期刊

媒介多彩贵州风媒介手段整合推广

中国玉文化旅游资源价值评价

<正>在中国的历史上,"玉"除了是一种具体的珠宝之外,更多地作为中华民族文明的载体,表现着丰富多彩的民族文化内涵,形成了具有中华民族特色的玉文化。中国不仅是用玉最早的国

期刊

旅游资源价值中华民族玉文化文化旅游资源

三严三实护航国企改革

<正>开展"三严三实"专题教育,是巩固党的群众路线教育实践活动成果、进一步加强党的思想政治建设和作风建设的需要;是严肃党内政治生活、严守党的政治纪律和规矩的需要;是锻

期刊

三严三实党的群众路线教育实践活动专题教育思想自觉国企改革

抓住关键词语,指导学生朗读

<正>《语文课程标准》明确指出:"阅读教学是学生、教师、文本之间对话的过程。"文本中许多有价值的东西需要学生通过朗读,逐步体会和感悟,教师的责任是要在学生和文本之间建

期刊

指导学生少奇同志夜间飞行阅读教学

中国抗战电影巡礼

长达14年的抗日战争给中国人民造成了巨大深重的民族灾难,为电影提供了丰富的创作资源。从1931-2005年,中国大陆、香港、台湾三地共拍摄了200多部抗战题材的故事片。抗战电影

期刊

抗日战争抗战电影史略特征

阿里巴巴打造电商帝国

<正>自Facebook上市的光环失色之后,不管是公募机构还是私募机构对世界互联网公司的投资热情都日益消减,甚至有专家预言互联网的寒冬即将到来,大金额的互联网融资案将会绝迹

期刊

阿里巴巴市场份额阿里巴巴集团

基于图形处理器的高速并行算法研究

其他学术论文