基于监督流形学习算法的固有不规则蛋白质结构预测研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:yangjianwu2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的顺利进展,越来越多的蛋白质序列被测定出来,而利用实验方法测量蛋白质及生物大分子的结构相当繁琐,既耗时又费力,因此利用理论计算方法来研究蛋白质的结构和功能从而指导实验是一项非常有意义的工作。
  本文从蛋白质的一级序列出发使用多分类器组合算法对固有不规则蛋白质结构进行分类研究,论文主要工作如下:1、构建规则和不规则蛋白质序列这两类序列集,依据长度不同的不规则蛋白质序列中氨基酸残基含量的不同,将不规则数据集分为长(>30个氨基酸残基)和短(≤30个氨基酸残基)两个序列集。2、基于氨基酸序列的单肽、双肽结构属性和疏水性物理属性出发,利用滑动窗口法将氨基酸序列量化,利用径向基核函数的支持向量机方法构建成员预测器模型。利用5倍交叉验证法确定长、短序列的窗口长度以及由此确定支持向量机核函数的参数值gamma值和惩罚系数coat值。3、在特征提取方面,由于滑动窗口法得到的数据矩阵容易形成维灾难,需要对矩阵进行维数规约,即将数据由高维空间投影到低维空间。主要分析了现在常用的降维方法包括线性降维方法中主成分分析法(PCA)以及一种基于PCA方法发展起来的一种非线性降维方法-核主成分分析法(KPCA)。在此基础上本文将流形学习算法中局部线性嵌入法(LLE)引入了固有不规则蛋白质结构预测中,并利用实验方法对PCA、KPCA以及LLE算法进行了验证,得出基于LLE方法的降维效果最好,从而得出蛋白质序列中氨基酸残基之间存在局部线性关系。4、为了提高固有不规则蛋白质结构预测精度,本文提出了一种基于Adaboost算法的SVM预测器融合方法预测固有不规则蛋白质结构。因此了解了预测器融合的基本概念、体系框架、成员预测器的设计方法以及Adaboost算法的基本原理和实现步骤。通过实验结果可以看出,利用多预测器融合算法后的预测精度明显优于单个成员预测器的预测精度。
其他文献
会议
期刊
期刊
期刊
图像的矩函数和其不变性的定义起始于上世纪的60年代。自1961年Hu首次提出矩的不变性理论以来,矩和矩函数已经被广泛应用于图像处理和模式识别的各个领域。几何矩是最早出现的矩,它构造简单,计算方便。不足之处是在处理一些复杂的图像时,变换不是很方便,且随着阶数的增加,出现计算不稳和不易集中分析的现象。正交矩的显著特点就是可以描述图像的独立特征,具有最小的信息冗余度;由于其取值范围有一定的要求,常在计算
学位
期刊
学位
期刊
随着互联网的飞速发展,网上身份认证得到了广泛的应用。而USB Key作为网络身份证,成为网上身份认证的合适载体。USB Key是集成电路、智能卡以及密码算法发展的高度结合的产物。目前,USB Key的安全性隐患主要在于用户的交易信息仅在PC端显示。如果USB Key的PIN码被木马程序或者钓鱼网站窃取,那么用户的安全就得不到保障。  基于以上考虑,可以在USB Key物理硬件上面增加能够显示用户的
学位
期刊