【摘 要】
:
关于蛋白质家族、结构和新功能的统计推断是应用数理统计的一个前沿交叉研究方向。本文以蛋白质结构分类数据库SCOP和序列分类数据库Pfam为基础,研究有关蛋白质家族和折叠子
论文部分内容阅读
关于蛋白质家族、结构和新功能的统计推断是应用数理统计的一个前沿交叉研究方向。本文以蛋白质结构分类数据库SCOP和序列分类数据库Pfam为基础,研究有关蛋白质家族和折叠子的统计推断问题。
首先,在第二章中我们利用两类不同数据库之间的映射,分别研究了包含于不同类折叠子中的蛋白质家族规模的分布,这些家族包括蛋白质序列分类数据库Pfam中的家族、蛋白质结构分类数据库SCOP中的家族以及由SCOP家族映射后得的相应Pfam家族。并由此得出了蛋白质家族规模分布与包含它们的折叠子的规模无关,均服从相似的幂率。同时推断出SCOP家族空间是Pfam家族空间的一个随机样本的结论。
其次,在第二章结论的基础上,结合SCOP数据库的动态信息,我们估计出覆盖当前Pfam数据库所需的折叠子总数;通过SCOP中新增家族在Pfam中的对应家族所属的折叠子是否已知为先验信息构建贝叶斯模型,估计了不同规模的Pfam家族贡献新折叠子的概率分布。
最后,我们利用SCOP最新版本1.73中观察到的折叠子规模的分布,依据最大概率原则和矩法估计原理重新估计了自然界中折叠子规模的分布,并在此基础上重新估计了自然界中蛋白质折叠子的总数。
其他文献
基于Hilbert空间和Banach空间中的几何理论及非线性算了理论,本文用不同的方法对非扩张映象、半相对非扩张映像、渐近半相对非扩张映像的不动点问题进行了研究,得到了一些有效
近年来,动理学方程的研究备受关注,因为它涉及很多重要现象和科学领域,如核反应堆扩散现象、电磁辐射扩散现象、等离子体的动力学、稀薄气体的数学理论、天体物理及航空科学领域
由于实际问题的复杂性和人们对实际问题理解的逐步深入,目前已经发现用混合分布拟合实际数据的总体分布有很好的效果.本论文主要研究混合分布中参数的估计问题.
设F1(χ)
非光滑优化问题是指目标函数和约束函数中至少有一个不是连续可微的数学规划问题,它是最优化理论与方法中一个重要的分支,由于其不具有连续可微的性质,传统的微分概念和优化理论
本文主要讨论四阶特征值问题:L(ψ)=((а)4+q(а)2+p(а)+r)(ψ)=λ(ψ),借助于位势(q,p,r)与特征函数(ψ)之间的关系,将其相应发展方程族的Lax对非线性化,得到特征值问题的Bargman
差分方程有着深刻而生动的实际背景,它从生产实践与科学技术中产生,而又成为现代科学技术中分析问题与解决问题的一个强有力的工具。在经济金融保险领域、生物种群的数量结构
关于模糊元图的结构问题,自上世纪九十年代以来,国内外很多学者就已经运用其结构取得了丰硕的成果。但是,至今还未对模糊元图进行严格的数学刻画。本文正基于此,提出了不同于以往
本文研究利用LQ随机最优控制理论来求解非完备市场下的连续时间最优投资组合问题。
最优投资组合问题是金融投资领域讨论最为集中的话题,而Harry Markowitz的均值-方差