论文部分内容阅读
RNA(脱氧核糖核酸)是生物系统内最为重要的分子之一,它在生物体内行使多种功能。预测RNA二级结构具有重要意义,知道了RNA的二级结构就可以获得许多有益的信息,不仅能使我们更细致的了解各类RNA在细胞中的运作机制,而且可以为寻找新的基因、治疗疾病提供帮助。RNA的一级结构用实验的方法容易测定,但是由于RNA分子具有降解速度快、难以结晶等特点,故通过X射线晶体衍射和核磁共振(NMR)等实验方法去测RNA分子的空间结构很不容易,这样费时费力还代价高昂,虽然测得的结果比较精确可靠,可是面对当前海量的生物序列,这种方法显然是跟不上要求的。故而像蛋白质结构研究一样,借助于计算机手段和各种数学方法从理论上去预测RNA空间结构,是提高我们认识RNA空间结构效率的一个捷径,也是我们应当主要依靠的方法。本文对RNA二级结构预测问题进行了详细的阐述,并在充分汲取现有预测方法优点的基础上,创新性地提出了两种RNA二级结构预测算法,有效地提高了预测的精度。具体地,本文的主要研究内容和创新点如下:首先,介绍了RNA二级结构预测方法,包括问题的数学模型、测试数据来源以及当前主流算法和软件。同时还说明了这些软件的优缺点及各自的使用范围。其次,介绍了RNA二级结构预测中比较经典的最小自由能算法,分析了其优缺点以及使用情况。在此基础上提出了基于茎区的动态规划算法来预测RNA二级结构,并结合茎区树的结构实现了假结的预测,然后将本算法与最小自由能算法进行了对比实验分析,实验结果证明,本算法提高了预测的精度,降低了时间复杂度。第三,提出了一种基于随机上下文无关语法模型的算法来预测RNA二级结构及其假结。通过搜索茎区池寻找最优子结构来设置语法的生成概率,使用BestFirstSearch搜索策略来寻找最大概率的语法推导路径,并使用动态规划的思想来降低时间复杂度,实验结果表明算法的预测精度有所提高并能够预测假结。第四,实现了一个RNA二级结构预测系统,该系统集成了本文中提出的RNA二级结构预测算法。最后,本文对RNA二级结构预测的前景进行了展望,探讨了该领域进一步的研究方向。