RNA二级结构预测算法的研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:gyqg1q
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RNA(脱氧核糖核酸)是生物系统内最为重要的分子之一,它在生物体内行使多种功能。预测RNA二级结构具有重要意义,知道了RNA的二级结构就可以获得许多有益的信息,不仅能使我们更细致的了解各类RNA在细胞中的运作机制,而且可以为寻找新的基因、治疗疾病提供帮助。RNA的一级结构用实验的方法容易测定,但是由于RNA分子具有降解速度快、难以结晶等特点,故通过X射线晶体衍射和核磁共振(NMR)等实验方法去测RNA分子的空间结构很不容易,这样费时费力还代价高昂,虽然测得的结果比较精确可靠,可是面对当前海量的生物序列,这种方法显然是跟不上要求的。故而像蛋白质结构研究一样,借助于计算机手段和各种数学方法从理论上去预测RNA空间结构,是提高我们认识RNA空间结构效率的一个捷径,也是我们应当主要依靠的方法。本文对RNA二级结构预测问题进行了详细的阐述,并在充分汲取现有预测方法优点的基础上,创新性地提出了两种RNA二级结构预测算法,有效地提高了预测的精度。具体地,本文的主要研究内容和创新点如下:首先,介绍了RNA二级结构预测方法,包括问题的数学模型、测试数据来源以及当前主流算法和软件。同时还说明了这些软件的优缺点及各自的使用范围。其次,介绍了RNA二级结构预测中比较经典的最小自由能算法,分析了其优缺点以及使用情况。在此基础上提出了基于茎区的动态规划算法来预测RNA二级结构,并结合茎区树的结构实现了假结的预测,然后将本算法与最小自由能算法进行了对比实验分析,实验结果证明,本算法提高了预测的精度,降低了时间复杂度。第三,提出了一种基于随机上下文无关语法模型的算法来预测RNA二级结构及其假结。通过搜索茎区池寻找最优子结构来设置语法的生成概率,使用BestFirstSearch搜索策略来寻找最大概率的语法推导路径,并使用动态规划的思想来降低时间复杂度,实验结果表明算法的预测精度有所提高并能够预测假结。第四,实现了一个RNA二级结构预测系统,该系统集成了本文中提出的RNA二级结构预测算法。最后,本文对RNA二级结构预测的前景进行了展望,探讨了该领域进一步的研究方向。
其他文献
随着互联网的迅猛发展和信息的国际化,对于不同语言文本内容的理解和传播成为了人们的强烈需求。机器翻译这个古老的课题在这样的背景下重新焕发了生机。词对齐作为统计机器
Internet已经深入到我们生活的方方面面,成为人们日常活动中不可缺少的一部分,但目前大都采用的固定接入的方式使用Internet,这在很多方面限制了它的进一步应用。同时,伴随着
随着生命科学的发展,人类越来越关注于对自身的认识。计算机技术的发展使得研究人员可以通过建立生物体各级生理对象的数学模型的方式来研究其生理学过程,大大推动了人类对生
在传统的基于内容图像检索的方法中,由于图像的领域较宽,图像的低级视觉特征和高级概念之间存在较大的语义间隔,检索的效果不很理想。文章研究了图像增强技术在贝叶斯框架下
分布式数据库系统(Distributed Data Base System,DDBS)的研究开始于20世纪70年代。由于数据库应用需求的扩展和计算机硬件环境的改变,特别是计算机网络与数字通信技术的飞速
入侵检测作为一种主动的安全防御手段,通过对网络上的数据流进行实时分析,发现潜在的入侵威胁,最大限度地提高网络的安全保障能力。本文首先分析了当前网络安全现状及其对策
鉴于基于内容图像检索(Content-Based Image Retrieval,CBIR)技术的高效性,人们开始研究它与Web的结合,以提高互联网图像检索效率。Web与CBIR技术的结合,已逐渐成为基于内容
作为最自然的人机交互方式之一,手势识别一直是近年来人机交互与计算机视觉领域的热点研究领域之一,大量的研究致力于利用现有的视觉设备得到实时稳定,鲁棒性高的跟踪与识别
一词多义现象给计算机对自然语言的处理带来了许多困难,有不少自然语言理解领域的问题归根到底是解决词语歧义的问题。从人们最初注意到歧义的影响至今已经过去了60多个年头,
纸币识别器是自助售卖领域的核心设备之一,目前已广泛应用于各种金融交易场合。但随着嵌入式技术的发展,8位或16位单片机裸机已经越来越不能满足应用的需要。而基于金融货币