论文部分内容阅读
蛋白质在生物体新陈代谢、发育生长等一切生命活动中发挥着重要的作用。近几年,蛋白质折叠速率已成为分子生物学的研究热点之一。研究内容大部分集中在蛋白质所处环境、蛋白质特征结构等方面。而蛋白质各级结构均可由氨基酸序列预测得到,所以,氨基酸序列对蛋白质折叠速率的影响是不容忽略的。研究者们从各种理论方法入手去探索氨基酸序列对蛋白质折叠速率的影响。我们从氨基酸的约化分类入手,研究氨基酸序列对蛋白质折叠速率的影响。另外,研究结果表明非编码序列在生命活动中扮演着十分重要的角色。环状RNA的形成与特性已成为当前的新兴热门话题。环状RNA是一类由内含子之间或者内含子与外显子通过特殊的选择性剪切形成的一种新型的非编码RNA。研究表明,环状RNA在调节基因转录、生长发育、疾病预测等方面有着巨大的潜在价值。本论文首先对氨基酸进行约化分类,研究了不同类氨基酸的相对氨基酸使用度对蛋白质折叠速率的影响,然后,运用局域比对等方法,统计了同一RNA序列中内含子之间的相互匹配关系,试图探讨环状RNA的成环机制。具体内容如下:1.根据氨基酸的约化分类,定义了一个描述氨基酸序列信息的参量—相对氨基酸使用度(RAAU),在相关文献和数据库的基础上,建立了一个包含相对氨基酸使用度和蛋白质折叠信息的折叠数据库。2.以数据库中全部蛋白质作为数据集,统计分析了蛋白质折叠速率ln(k_f)值与相对氨基酸使用度(RAAU)的相关性。结果显示,不同类氨基酸的相对使用度对蛋白质折叠速率的影响有显著差异。其中,强亲水类氨基酸、脯氨酸与甘氨酸的相对使用度与蛋白质折叠速率具有很好的相关性。3.将蛋白质分成二态蛋白质和多态蛋白质,然后以每类蛋白质作为研究对象,统计分析了相对氨基酸使用度对蛋白质折叠速率的影响并作了它们之间的线性关系图。结果表明对于不同折叠类蛋白质(二态蛋白质和多态蛋白质),同一类氨基酸的使用度对不同折叠类蛋白质折叠速率的影响有很大差异。4.以人类核糖核蛋白基因为研究对象,提取了每个蛋白前体RNA中所有内含子序列。以此为基础,统计了第一内含子的长度分布特征,结果显示,第一内含子长度大多集中在80bp、240bp左右。5.将除第一内含子外,其余各个内含子序列转变成互补序列后,利用局域相似性比对软件,分析它们之间的匹配特征,得到最佳匹配片段,以及最佳匹配片段长度及其GC含量分布。结果表明:最佳匹配片段长度约在15bp处所占比重最大,最佳匹配片段GC含量分别在0.62与0.41处出现极大值与极小值。6.在得到最佳匹配片段的基础上,统计了第一内含子序列最佳匹配片段相对位置分布。在此基础上,把第一内含子序列片段按照GC含量分为高GC组和低GC组,在两组内含子中分别统计了第一内含子最佳匹配片段相对位置分布。结果表明:对于总第一内含子序列,最佳匹配片段相对位置呈正态分布,最佳匹配片段处于50-70bp处。而对于高GC组,最佳匹配片段处于60-70bp处,而对于低GC组,出现了多个峰值。