论文部分内容阅读
本文系统介绍了矩阵奇异值分解在叶绿体的物种进化树构建过程中的应用,在预备知识中给出了实矩阵的奇异值分解定理以及它的证明,该定理足本文涉及的生物信息处理的主要依据。分子系统发育分析是生物信息学中的一种基本方法,用于研究生物体在分子水平的进化式样、方向、速率以及各种分子机制对基因和基因组的结构与功能的影响。我们还介绍了系统发育分析的若干基本概念、分子系统树的构建以及相关的计算机软件。构建物种进化树的变质是蛋白质序列分析,我们根据实际需要选择C语言、Matlab、Phylip等软件来进行信息处理。从第三章开始介绍物种进化树的构建过程。第一步上作是借助计算机对每一物种进行有重叠的四肽统计,最终将蛋白质垒长基因组转化成一个稀疏的实矩阵,该矩阵我们称之为蛋白质矩阵。一般说来低十四肽的统计所获得的信息是非常有限的,另一方面鉴于计算机信息处理能力的限制,更高肽的统计也不现实。PHYLlP轼件足一个专门用来构建进化树的软件,在第三章我们简单并有针对性地介绍了它的部分功能及使用方法。第四章开头部分介绍如何构建叶绿体的物种进化树,我们得到的是一棵未经“去噪”处理的进化树,井仔细分析了该树的不足之处。接着介绍了如何将矩阵奇异值分解应用于物种进化树的构建。目的是在构建进化树之前去掉蛋白质矩阵中的“噪音”以减少其中的数据冲突,并且得到了一棵改进的进化树。最后对所得的结果进行了客观地分析,通过与其他学者所得的成果进行比较,我们发现直接将矩阵奇异值分解应用十物种进化树的构建其效果并不理想。