生物序列的比对算法研究和软件优化实现

来源 :中国科学院计算机网络信息中心 | 被引量 : 0次 | 上传用户:made5215210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是在生命科学研究中综合运用数学、计算机科学和生物学知识与工具对生物信息进行存储、检索和分析的新兴交叉学科,是当今生命科学的重大前沿领域之一,也将是21世纪自然科学的核心领域之一。其中序列比对分析是生物信息学计算的核心,也是许多领域的关键研究手段。正是基于这种研究现状,本论文以序列比对问题作为主要研究内容,针对基于结构的RNA序列比对问题展开研究。   本文的主要工作包括:   1、详细讨论了生物信息学中的序列比对问题,分析了相应的各种算法;   2、系统研究了RNA序列分析所用到的Rfam数据库及INFERNAL软件包,给出了比对分析的具体流程;   3、详细讨论了进行RNA结构比对分析所采用的协方差模型和理论方法,给出了完整的理论分析过程:首先通过KNA的多重比对得到一致序列的二级结构,由二级结构信息生成向导树,根据向导树便可得到所需的协方差模型,进而执行此模型与目标序列的比对分析。   4、针对在与中科院生物物理所的合作研究中发现INFERNAL软件包的运行存在效率较低的问题提出了并行优化的设计思想,结合MPI消息传递环境实现了程序的并行化,完成了程序的并行版本。通过在联想深腾6800高性能计算机上进行性能测试,得到了较理想的加速比和较高的并行效率。试验表明,并行优化程序对于大数据量的结构比对能有效缩短执行时间,因此具有显著的现实意义。   5、考虑到生物信息研究中出现的资源孤岛问题,并结合国家863项目“中国国家网格”的实际需求,讨论了GOS网格操作系统和中国国家网格环境,并将INFERNAL并行优化程序成功移植到网格环境下,实现了其基于Web方式的网络服务功能。从而能够为生物信息的研究工作者提供更为便捷的服务。
其他文献
通信网络地理信息集成系统以一个省为单位,管理全省的电信通信管线网络。城市的分布范围一般较广,所有的通信设备和通信线路由电信局共享。因此,采用客户机/服务器的体系结构。服
Web服务是一种自描述、自包含和松耦合的计算模式,它提供了一种新的Web应用模型,具有平台和语言无关的特性。随着面向服务架构的研究与应用,越来越多的Web应用和业务流程以Web服
现有传统网络已逐渐无法满足实际业务的需求,软件定义网络(Software-Defined Networking,SDN)的提出,不仅仅是一种革新的理念,它更是一种顺应时代需求而自然孕育的产物。控制转发
异构数据的集成一直都是网络数据通信、信息共享的热点研究问题。数据的异构可分为四个层次:结构异构、语法异构、系统异构和语义异构。如何有效屏蔽或消除数据源不同层次上
随着互联网短文本数据爆发式的增长,如何从短文本中找出人们关注的有价值的事件,即基于短文本的事件探测技术,成为学术研究领域的热点问题。而微博数据是短文本事件探测的典型数
在多媒体技术日益广泛的今天,图像的通信和存储占有重要的位置,数字图像包含信息量巨大的特殊性使得压缩技术成为其关键,因而探索高效图像压缩编码算法无疑将成为国际公认的
人体器官的三维重建与虚拟手术模拟是当前科学计算可视化最活跃的领域之一。肝脏作为人体最重要的器官之一,其手术也是外科手术中最复杂和失败率较高的手术之一,因此,肝脏虚拟手
随着市场竞争的加剧以及信息社会需求的发展,从大量数据中提取信息并用之于市场策略中的要求显得越来越迫切。近年来,数据仓库、OLAP和数据挖掘等面向决策支持的技术飞速发展,其
软件过程技术通过建模、运作、监控、度量过程模型,对实际的软件过程提供指导和控制,从而保证软件开发的质量、提高软件开发的效率。对软件过程的研究已经成为软件工程领域的研
学位