随机蛋白质序列全局对位最优分的理论分布研究

来源 :西北农林科技大学 西北农林科技大学 | 被引量 : 0次 | 上传用户:cjp023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列对位是最常用的一类生物信息学研究方法。它在序列的功能、结构及进化关系预测、数据库搜索,系统发生树构建等方面有着广泛用途。然而,序列对位所得到的分值本身并不能说明太多问题,还需要进一步判定它在统计上是否显著,即随机得到这个得分的概率有多大,从而推断其在生物学上的意义。本研究目的是找出随机蛋白质序列得分的理论分布,从而为从序列对位的统计显著性推断出生物显著性奠定基础。 本研究中选用了真实不相关序列和五种随机序列作为背景序列,利用Needleman-Wunsch算法,对其进行全局对位,然后将对位得分与伽玛分布、正态分布和极值分布进行拟合分析,研究全局对位最优分的理论分布。 本研究中的真实不相关序列取自SCOP数据库,利用三种标准得到了各自的序列文件,即序列相似度小于10%的序列,E-value大于10的序列,以及取自不同折叠的代表序列。并对这些序列进行了处理,得到序列长度相似的一系列序列文件。本研究中的五种随机序列也是从SCOP数据库中随机抽取11对长度不同的不相关序列,采用不同的方法进行随机化,从而得到五种随机序列。这五种序列随机化方法分别是:1)根据序列长度和蛋白质平均氨基酸组成随机产生序列(ACL);2)根据原始序列的氨基酸组成分布和序列长度随机产生序列(CLA);3)对整条序列全局重排以保持氨基酸组成不变(GS);4)将序列分为几块,块内进行局部重排而产生随机序列,以保持局部序列氨基酸组成不变(LS);5)根据PAM突变矩阵模拟序列进化过程,使原始序列发生突变产生随机序列(SMP)。 本研究选择了四个得分矩阵-PAM120、PAM250、BLOSUM50和BLOSUM62,采用了仿射的(affine)和固定的罚分方法,对序列末尾同样罚分来进行全局对位分析。对于真实不相关序列,在每一个序列文件中的各对序列之间分别进行了全局对位;ACL和SMP序列则是一条原始序列与对另一条序列随机化后产生的新序列进行全局对位,然后再反过来;CLA、GS和LS序列则是一次产生一对随机序列,对其进行全局对位。然后将上面得到的各组得分作为样本,分别将其与三参数伽玛分布、正态分布和Gumbel极值分布进行分布函数拟合分析。 结果显示,三参数伽玛分布与所有组得分的拟合效果都很好,极值分布与所有组得分的拟合效果都不理想,而正态分布只有在三参数伽玛分布的位置参数很大时,有很好的拟合效果,因为这种情况下,正态分布是伽玛分布的极限分布。另外我们还发现,随着序列长度的增加,拟合得到的三参数伽玛分布的形状参数也增加,尺度参数却同时减小;随着局部重排块(window)的增大,三参数伽玛分布的形状参数减小;而采用哪种得分矩阵,对全局对位最优分的理论分布的影响并不大。
其他文献
基于视觉的手势交互,相对于鼠标、键盘等传统的人机交互方式,能够以非接触的交互方式避免对用户的侵入性,并且更加直观、更加自然,在虚拟现实、手语识别、智能操控等领域有着广阔
阴道毛滴虫(Trichomonasvaginalis)是一种寄生于人体阴道及泌尿道的鞭毛虫,该虫引起的疾病统称为阴道毛滴虫病,是最普遍的非病毒性性传播疾病之一。阴道毛滴虫除引起滴虫性阴道
近年来,移动通信业务的迅猛发展对无线通信网络的性能指标提出了更高的要求,国内外的科研工作者对多输入多输出(MIMO:Multi-InputMulti-Output)技术已经进行了深入的理论研究,并
纹理映射过程是真实感模型绘制技术中的关键步骤,纹理图像生成的好坏对生成模型的真实感影响重大。纹理映射技术是计算机视觉和计算机图形学中的重要研究方向,具有重要的学术价
本研究首先采用质粒共转染和竞争性RT-PCR方法对本组从HTLV-I活化的人外周血T淋巴细胞MATCHMAKERcDNA文库中筛选到的NRE结合蛋白ITF2B在Jurkat细胞、B3D5细胞及BJAB细胞中对I
本研究将产自广东省博罗县的福田菜心、酥醪菜、耙齿萝卜三个名优蔬菜品种搭载“神舟四号”宇宙飞船,6天后发现种子萌发和幼苗发育以及抗氧化能力均受到影响。  空间环境可
在当今社会飞速发展的环境中,图像处理技术已经变得越来越重要,图像的数字化处理已经在科学研究、医疗卫生以及国防军事等领域发挥着越来越大的作用,大的方向包括国防上用的无人
互联网的快速发展方便了我们的生活,同时也给我们的个人信息安全敲响了警钟。我们银行卡里的钱可能被非法分子盗用,我们在网上的个人信息可能被黑客窃取并用于犯罪。越来越多的
p27Kip1基因编码一个周期蛋白依赖性激酶抑制蛋白(cyclin-dependentkiBaseinhibitor,CKI),属对CDK(cyclin—dependentKinase)-cyclin复合物具有广谱抑制作用的p2i家族。其编码
香糯竹(Cephalostachyumpergracile)——唯一一种用于烧制竹筒饭最佳的竹子,是植物系统分类学研究中具有重要学术价值并具有特殊文化内涵的珍稀竹种,由于其自然分布区狭窄,种质