基于GPU高性能计算的下一代高通量DNA序列比对

来源 :厦门大学 | 被引量 : 0次 | 上传用户:sea0972
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,由于生物学研究中DNA测序技术的革命性突破,使得高通量测序技术的应用越来越广泛。作为下一代测序技术,高通量测序以其低成本,高产出的优势使得过去只有大型测序中心才能进行的项目,现在在小型实验室也能顺利开展。而其最显著的高通量特点,使得一次测序可获得的序列信息从过去的上百条飞跃至现在的上百万条、甚至千万条,在提供更加丰富序列信息的同时,也产生了前所未有的海量数据。如此爆炸式增长的数据,对传统的信息学处理技术提出了新的要求,如何寻求一种低成本、高效率的技术来处理这些海量数据,成为了当务之急。   另一方面,GPU计算作为一项新兴技术,虽然还无法应用于所有类型的通用计算任务,但是得益于其大规模并行的硬件架构特点,对于一些特定类型的计算,尤其是数据密集型的计算,具有明显的加速效果。在科学计算领域(如生物信息学,分子化学,气象预报等),已经有越来越多的GPU计算实例。   本文在对GPU高性能计算技术和高通量DNA序列处理的研究基础上,讨论了如何利用GPU实现高通量DNA序列的处理,分析了两种针对GPU硬件结构的算法并行优化方式。同时,本文提出了一种通过工具框架分离使用和实现的解决方式,利用框架的设计与封装,对最终的用户屏蔽引入GPU计算带来的复杂度。并实现了框架的雏形AlignGPU,AlignGPU可以支撑序列比对中的相关操作,并提供一定数量的扩展接口,用以满足不同研究中特性化需求的实现,在对利用454高通量测序法测序得到的某动物基因数据处理中,AlignGPU的性能相对于传统的CPU算法要快近60倍。最后,论文讨论了对于高通量DNA序列处理,GPU是否是有效的方法策略。  
其他文献
20世纪90年代以来,随着信息科学技术的发展,尤其是以TCP/IP为基础的互联网取得了巨大成就后,人类活动开始步入了网络时代。从Internet到WWW,从大型电力网络到全球交通网络,从社会
切换区间系统是一类系统矩阵为区间矩阵的切换系统,它既具有区间系统的参数不确定特性,又具有切换系统的特性,比一般的切换系统更具复杂性。另一方面,在许多实际的控制系统中,大量
在自然界,有许多生物,根据空气中的化学信息或者说气味来寻找配偶、发现猎物、搜寻食物、躲避天敌等。此外,由于全球空气污染越来越严重,人类频频受到有害、有毒气体泄漏事故的侵
机器翻译是应用电子计算机实现从一种自然语言到另外一种自然语言的翻译。它属于计算语言学的范畴。经过几十年的发展,机器翻译在理论和实践方面都取得了非常大的进展,基于统计
无人机正逐渐向着微型化、集成化、智能化、成本低、功耗低的方向发展,从而使其在军事和民用领域应用越来越广泛。由于微小型无人机的结构特点,其在空中飞行时,飞行稳定性很
随着社会和互联网技术的进步,视频监控技术也逐渐数字化和网络化。网络摄像机便是视频监控设备数字化与网络化的产物,它是将传统的模拟视频信号转变成数字视频信号,并且借助现有
立体匹配是立体视觉研究中最关键的问题之一,该技术通过寻找匹配点来获取距离信息,为实现三维立体再现提供依据;但同时也是最难彻底解决的问题,主要包括匹配精度和匹配效率的
自人类检测到脑电活动以来,人们便开始探讨利用控制脑电的方法治疗神经性疾病,脑电生物反馈疗法便是这些研究之一。脑电生物反馈疗法是一种用于解除生理和心理不适的方法,它
近年来,计算机计算能力的提高和网络带宽的增加带来了计算模式的变化。在这种背景之下,结构化对等网络在十数年间得到了迅猛的发展,并在应用上得到了长足的进步。但是,在这个过程