论文部分内容阅读
RNA是由A、C、G、U四种不同的核苷酸组成的单链。RNA通过自身回折,使链中的一部分核苷酸与其它部分核苷酸互补配对,形成RNA二级结构。RNA二级结构的计数研究是计算分子生物学的重要课题之一。由于RNA二级结构经常被抽象为离散的数学对象,从而使得离散数学和分子生物学密切联系在一起。一方面,组合技巧成功的应用到了RNA二级结构的计数问题中;另一方面,RNA二级结构的计数问题启发了新的有趣的组合问题。另外,人类基因组计划的实现产生了大量的数据,如何选择有效的方法从这些数据中提取信息,进而分析物种间的进化关系,将面临着巨大的挑战。本文主要研究了RNA二级结构的组合计数问题及其进化分析,主要内容如下:
一、详细介绍了RNA二级结构的基本信息,主要包括二级结构的各组成元素以及各种传统的表示形式,并且利用发生函数的方法讨论了限制端环长度的RNA二级结构的计数问题。另外,给出了一种计算Sm(n)的方法。
二、为了化简限制端环长度的RNA二级结构的递推公式,建立了二级结构与组合数学中三种特殊的集合间的一一对应。通过建立的双射关系,得到了关于限制端环长度至少为m且有k个基对的二级结构数Sm(n,k)的一个封闭和式。
三、按照Watson-Crick碱基配对原则,用圈表示A(U)而用点来表示G(C),提出了RNA二级结构一种新的表示形式。这种表示比传统的表示形式更为合理。在此基础之上,研究了以端环长度为参数且带有各种限制条件的二级结构的计数问题,并且进一步研究了同时选取端环和堆积的长度作为参数的二级结构的渐近计数问题。
四、将两组复杂的RNA二级结构分别转换成定义在20个字符上的线性符号序列,计算出其LZ复杂性,进而基于两种不同的算法构造了进化树,结果充分证明了我们方法的有效性。