论文部分内容阅读
生物信息学是在数学、计算机科学和生命科学的基础上形成的一门新型交叉学科,是指为理解各种数据的生物学意义,运用数学、计算机科学与生物学手段进行生物信息的收集、加工、储存、传播、分析与解析的科学。序列相似性是生物信息学处理中的最基本的问题。如何获得结果更准确,时间和空间效率更高的序列相似性比较算法是生物信息学研究中的一个重要课题。序列比对就是通过一定的算法对两个或多个序列进行比较,找出序列间最大的相似性匹配。Smith&Waterman算法是一种经典的序列比对算法,在双序列比较的情况下具有比较好的速度和结果,但是在进行序列数据库搜索时则显得处理速度不足。论文主要讨论了Smith&Waterman算法以及在脉动式阵列上的加速。通过对Smith&Waterman比对算法的并行化方法的考察,引出细粒度并行化方法和定制硬件,特别是脉动式阵列;通过对脉动式阵列的结构和特点的分析,结合龙芯I号处理器的结构,设计了龙芯I号新的协处理器CP2为一个脉动式阵列,并设计了相关的一组指令集;通过对龙芯I号的模拟器的修改,实现了该协处理器和指令集;在算法和系统结构互相制约的基础上,描述了算法在脉动式阵列上的实现,明确了算法实现过程中的一些实现细节;最后通过在新的模拟器和原模拟器上的性能比较,针对实验数据中体现的协处理器的优势和不足,总结了脉动式阵列结构在各个方面对算法性能提高的影响,最后总结了已完成的实验内容以及未来工作的一些方向。