单指令多线程相关论文
随着国内集成电路行业的飞速发展,芯片复杂度的不断提高,如何确保所研处理器的正确性成为了芯片研发流程中的一个重要内容。指令集......
摘要:GPU内部大量线程的同时运行会生成大量的访存请求,当访问同一L1 Cache組的访存请求所涉及的空间超过L1 Cache一组的容量时,由于......
目的:为了克服传统高斯模糊方法处理速度容易受模板大小局限和图像边界处不能真实反映高斯模糊结果的缺陷,本文提出了一种基于计算......
BF算法是串匹配算法经典算法之一,但并不适合GPU这种并行体系结构。提出了基于统一计算设备架构(CUDA)架构的解决方案,通过对需要......
图形处理发展的目标始终是在计算机上呈现出更好的显示效果。为了满足人眼对这一目标的需求,图形处理系统需要更快的计算速率,更大......
提出了一种基于多图形处理器(graphic processing unit,GPU)设计思想的Harris角点检测并行算法,使用众多线程将计算中耗时的影像高斯......
现代3D图形处理器已从固定渲染管线发展成可编程渲染管线,且其并行度越来越高,研究并设计高性能的3D图形处理器对3D图形处理具有重......
由于Turbo码接近香农极限的优异性能,Turbo码自问世以来就受到了学术界和工业界广泛关注,迅速成为研究热点。Turbo码已广泛应用于3......
针对具有高浮点运算能力的流处理器设备GPU对神经网络的适用性问题,提出卷积神经网络的并行化识别算法,采用计算统一设备架构(CUDA......
提出一种基于GPGPU的CUDA架构快速影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法根据GPU的并行结构和硬件特点......