【摘 要】
:
随着GPU的发展,将通用的内存索引结构应用到GPU之上成为了一个新的研究方向。目前针对GPU优化的数据结构还比较少,特别地,现在只有很少的完全并发且可动态更新的内存索引结构
论文部分内容阅读
随着GPU的发展,将通用的内存索引结构应用到GPU之上成为了一个新的研究方向。目前针对GPU优化的数据结构还比较少,特别地,现在只有很少的完全并发且可动态更新的内存索引结构能够适应GPU,并且没有充分发挥出GPU的并行加速能力。为此,本文将设计实现基于GPU的Hash索引结构。本文的工作内容有三点:1.对内存索引结构进行了综述与性能评估。在Masstree、Cuckoo hash table和Hopscotch hash table三种结构的单线程比较实验中,Masstree的内存使用率最好但性能较差,而Hopscotch hash table不仅内存使用率较好性能也是最优的;在 Masstree、Skip list、Cuckoo hash table 和 Hopscotch hash table 四种结构的并发版本中,Cuckoo hash table的性能最好。2.对一种基于GPU的静态Cuckoo hash table(CUDPP实现)进行了改进,采用warp协同工作共享策略,显著减少了 GPU程序的分支与发散。改进后的实现,在内存使用率较高且插入操作数量较多的情况下,可以获得更快的构建速度。3.提出并实现了基于GPU的完全并发且可动态更新的Hash索引结构一一GLHT(GPU lock-freeHopscotchhashtable)。GLHT 结合 warp 协同工作共享策略和高效的GPU内存合并访问,与现有的CPU Hopscotch hash table相比,具有4-9倍的性能优势;比采取预先分配内存的GPU Chained Hash table更加灵活,并且在写操作较多的工作负载中获得了更好的性能。
其他文献
高光谱遥感图像有几十甚至上百个连续的光谱通道和丰富的空间结构信息,但光谱信息有较高冗余性,图像中判别性特征提取较困难。针对这两个问题,本文重点研究波段选择方法和利用深度网络学习判别性特征去分类的方法,主要工作如下:(1)针对光谱信息冗余性高的问题,本文提出了基于局部潜能的聚类算法,去除原始波段中的冗余信息,选择更具代表性波段。波段局部潜能思想考虑了波段间的差异性,能更好刻画波段分布情况,并在提出的
爱一个人不是你该如何的忘记而是该如何原谅,不是你该如何倾听而是该如何的领会,不是你双眼所看到的但却是你所能体会的,不是该如何的放开却是该如何的紧握珍惜。
“It's time…”是英语里一个常用的句型,它表示“该做……;是……时间了;该做……的时候了”。现在把其基本结构和用法归纳如下: 一、It’s time to+动词原形其中to是动
豆浆Soybean milk 烧饼Clay oven rolls 油条Fried bread stick 米粉Rice noodles 水饺(Boiled) dumplings 馒头Steamed buns,Steamed bread 汤圆Tangyuan,Stuffed dumpling
UNIPLET是捷克具有50多年历史的一家公司,从1949年建立以来,致力于发展、生产和销售优质的小直径编织机。
总公司Head Office 分公司Branch Office 营业部Business Office 人事部Personnel Department 人力资源部Human Resources Department 总务部General Affairs Department 财
如果你觉得心好像碎了,你不是唯一的一个。几乎每个人都会经历这种悲痛,我们有时称之为心碎——而有些人一生中似乎会心碎很多遍。只需回想一下我们在收音机听到的表达心碎的歌
1病例资料患者,男,56岁,以突发呼吸困难半小时入急诊室。伴有发绀,无胸痛、大汗、喘息及浮肿。既往高血压病史2年,一直坚持服用氨氯地平5mg血压维持在120—130/80—90mmHg;否认慢性
Many countries have adopted birds those are native to the country or which migrate through the region. Often they are chosen for their beauty, rarity, or some o