基于计算智能的蛋白质三级结构预测

来源 :济南大学 | 被引量 : 9次 | 上传用户:chouser1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质三级结构预测是由氨基酸序列预测蛋白质三级结构的过程。蛋白质结构预测的基本假设是蛋白质三级结构由其氨基酸序列唯一决定。研究蛋白质的结构意义重大,不但有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质之间的相互作用,而且对生物学、医学和药学都有非常重要的作用。历时十年的人类基因组计划产生了海量的生物序列数据,蛋白质序列数据与结构数据数量之间的差距越来越大,所以蛋白质结构预测变得日益紧迫和重要。本文所要研究的是如何构建一个蛋白质三级结构预测模型,使之能够更加准确有效的预测氨基酸对应的蛋白质三级结构。内容包括氨基酸序列的特征提取方式,神经网络结构设计及智能优化算法的选择。一、氨基酸序列特征提取。要对蛋白质结构进行预测,首先必须把氨基酸序列中的信息提取出来,转换成计算机可以处理的数据,即进行特征提取。选择何种提取方式非常关键,不同的特征提取出的信息大不相同,现在的方法主要有氨基酸组成模型(AA)、二肽组成模型、多肽组成模型、伪氨基酸组成(PseAA)、多特征融合、基于氨基酸物理化学性质等,从不同角度对氨基酸特征进行提取。本文采用了以上各种特征提取方式并进行了特征融合。实验表明,不同的特征提取方式对于不同的数据集和分类模型效果不同。二、分类模型的建立。蛋白质三级结构预测实际上是根据提取出的有用信息,通过学习分析这些信息,总结出规律,实现对未知结构氨基酸序列的结构预测。对于蛋白质三级结构预测这种信息维数高,计算量大的问题,借助神经网络是非常有效地。神经网络具有较强的自组织、自学习、自适应能力,能够快速学习到序列中包含的特征,实现对结构的预测。而对于网络,包括结构的优化和参数的优化两部分。选择何种优化算法是至关重要的,不同的算法会产生不同的时间效率,不同的算法对应不同的预测正确率。本文中将对各种不同的优化算法进行比较,选择出更适合的优化算法。实验表明,参数优化采用粒子群优化算法(PSO)能取得较好的效果。BP神经网络在蛋白质三级结构预测中能大大提高预测准确率。针对蛋白质三级结构预测这种多分类问题,本文提出将多类问题转换成多个二分类问题的集成。通过试验表明,单输出方式比多输出方式能有效的提高预测的正确率。为了寻找一种更优的网络结构,本文首次将灵活神经树(FNT)应用在蛋白质三级结构预测中,PSO对网络参数进行优化,概率增强式程序进化(PIPE)对网络结构进行优化。实验表明,这种模型在预测25PDB这样较大的蛋白质数据集中,效果理想。它不但解决了以前预测时只能提前固定网络结构和采用试探法选择隐层个数的问题,而且还能对高维特征进行选择性输入,实现了对原始输入的降维作用。
其他文献
语言人类学认为语言既是一种社会工具又是一种文化实践,它着重考察人类各地语言使用与文化的关系.话语分析和交际民族志是语言人类学研究的两个重要视角.话语分析是针对社会
被后世推为天台宗九祖的湛然(711—782)生活在8世纪,中唐时期。其主要活动区域在吴越地区。天台宗自智顗(538—597)-章安灌顶(561-632)之后,经历了法华智威(?-680)、天宫慧威
都匀经济开发区大力发展影视文化产业,逐步形成了以影视为主线,影视服务、体验式旅游为主体的业态布局,助力经济社会发展和脱贫攻坚跑出“加速度“。
文章介绍了某水厂在进行生产时应用聚丙烯酰胺的要点,主要包括在生产之前的综合生产调试,合理确定投加点、投加量和投加浓度,并总结、分析了投加的效果,为聚丙烯酰胺在水厂的应用
为体育俱乐部标志的成功推广与宣传,保证体育俱乐部标志的设计过程中的独创性。对体育俱乐部标志中常见的包括体育活动本身图形、文字字母、动植物图形等在内的基本元素,及体
应对提高景观设计“可持续性”的要求,提出了景观格局规划的概念,结合景观生态学原理,根据生态优先、生态全面性及生态可辩护性的规划原则拟定了规划方法框架,进而对框架中的理想
本文指出在改革开放浪潮中,传统文化与外来文化、新文化与旧文化的碰撞是必然要发生的。对待传统文化的态度虚无主义与至上主义都是认识上的形而上学。新文化既要摆脱传统文
模板的加工材料主要是木材,木模板一直以来都是应用最广泛的一类模板。这主要是因为其工序简单,且可迎合模板各种形状变化的需求。随着科技的发展,其施工工艺也在不断提高。
<正>照明是为人类提供光明的事业。从上世纪初电灯进入中国后,中华民族的照明电器工业经历了100多年的发展。一代又一代行业工作者,以执着的信念和不灭的热情,为光明的事业孜
针叶树是芬兰、瑞典、挪威、美国、加拿大等欧美国家主要的商品林树种。容器苗是针叶树重要的育苗类型。与裸根苗比较,容器苗具有育苗周期更短、造林季节可延长、苗木适应性