【摘 要】
:
蛋白质是一种重要的生物大分子,是生命活动的重要承担者,蛋白质的生物功能是由蛋白质的空间结构决定的,因而进行蛋白质结构预测对于理解蛋白质结构与功能的关系,以及分子设计
论文部分内容阅读
蛋白质是一种重要的生物大分子,是生命活动的重要承担者,蛋白质的生物功能是由蛋白质的空间结构决定的,因而进行蛋白质结构预测对于理解蛋白质结构与功能的关系,以及分子设计、生物制药等领域有很重要的现实意义。蛋白质二级结构预测是蛋白质结构预测的重要组成部分,是蛋白质结构预测最关键的步骤。神经网络作为机器学习的重要方法,在蛋白质二级结构预测中得到广泛的应用,被认为是最有前景的方法之一。 本文对蛋白质二级结构特性进行了研究,为了提高蛋白质二级结构的预测精度,建立了两个神经网络集成模型。第一个是以BP网络为集成的个体网络,根据蛋白质的二级结构是由其一级序列决定的并且神经网络输出之间具有相关性,采用两个串联BP作为集成的个体网络分类器。因网络规模庞大,不可避免存在过拟合,本文中采用两种方法来避免过拟合:首先在训练过程中采用“剪枝法”来精简网络的结构;在减少网络结构也无法避免过拟合时,即网络的预测精度继续下降,则“提前结束”网络的训练。为增加网络的差异度,利用bagging方法对样本重采样并加入随机噪声作为训练集,对个体网络取不同的隐层单元数,将5个具有一定差异度的个体网络利用相对多数“投票”规则进行整合。仿真结果表明此网络集成可以较好地对二级结构进行预测。但是BP网络是以“滑动窗口”技术为基础,这种技术只考虑了残基间的短程的相互作用而忽略了氨基酸之间的远程联系。而双向反馈神经网络BRNN可以捕捉所要预测位置和序列上下游信息之间的相关性,因此本文以BRNN为集成的个体网络建立第二个蛋白质二级结构预测模型。针对BRNN网络结构复杂、收敛时间长、参数多的特点,本文将BRNN网络的左、右子网络都减少一个隐层,并且采用BP改进算法中的弹性算法进行训练。仿真结果表明改进网络可以有效地缩短收敛时间,BRNN集成可以较好地预测二级结构。
其他文献
目的探讨HIV-1 gp120准种在不同治疗效果的艾滋病患者抗病毒治疗前的特征差异。方法回顾性收集治疗方案为AZT+NVP+3TC的艾滋病患者在抗病毒治疗前的血浆样本,包括病毒抑制(VS)组12例,治疗失败(TF)组12例。采用单基因组扩增技术获得gp120准种序列,分析比较遗传多样性、氨基酸长度、潜在糖基化位点及特征性氨基酸的特点。结果本研究共获得gp120序列365条序列,其中VS组168条(
煤层群采动覆岩裂隙演化与煤炭开采、卸压瓦斯渗流具有内在的联系,为建立煤炭开采与卸压瓦斯抽采(共采)的协同作用机制,阐明了共采协同的内涵,应用协同学理论建立了以单宽工
选取新城金矿新竖井-930 m以下6个水平的岩芯作为研究对象,从岩石力学性质、围岩应力状态、围岩条件3个方面选取8个评价指标,采用熵权法和逼近理想解排序法(TOPSIS法)建立了
有约束多源多目的路径问题是组合优化中的NP完全问题,它是在一个连通的无向图中,寻找包括所有源节点和目的节点的满足约束条件的最优子图集。有约束多源多目的路径问题的每一
为明确冲积扇储层成因及分布规律,结合油气勘探实践及野外露头观察,总结归纳了不同机制下冲积扇颗粒支撑砾岩的类型及其沉积分布特征.本文认为冲积扇洪水期、间洪期及碎屑(泥
热处理是提高金属材料及其制品质量的重要手段。近年来随着工业的发展,对金属材料的性能提出了更多更高的要求,因而热处理技术也向着优质、高效、节能、无公害方向发展。渗碳
电力系统是一个极其复杂的非线性动态系统,包含输配电线路和多种设备,它们之间相互影响,相互联系而形成巨维数电力网络。随着电力工业的迅速发展,电网结构日益复杂和庞大,而
陆相断陷盆地的构造-沉积充填演化受到主干断层的控制.为加深断陷盆地边界断层活动与层序沉积充填演化时空耦合关系的认识,以北部湾盆地涠西南凹陷为例,综合利用三维地震资料
受多期构造活动影响,黄骅坳陷上古生界烃源灶排烃特征及供烃模式不明,制约了该地区的油气勘探.针对存在的问题,基于录井、测井资料,运用岩心观察、地球化学分析及典型油气藏
破碎过程中颗粒强度是最重要的物料机械性质.物料最终的产物粒度分布主要取决于入料粒度的强度分布.利用WDW-100E微机控制电子万能试验机对尺寸为40~90 mm的煤岩颗粒进行单轴