基于集成学习的酰胺化位点预测

来源 :天津大学 | 被引量 : 0次 | 上传用户:sslplq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在蛋白质合成后,许多神经肽和肽激素需要将其羧基末端酰胺化来获得完整的生物活性,酰胺化在生物各种病理过程起着十分重要的作用,所以对其研究具有重要意义。用传统生物实验方法如生物质谱技术等进行研究有着劳动密集、需要时间长和成本高等缺点,而常见的机器学习算法对于特征空间的拟合不是特别完美,所以本文提出了一种集成学习算法来实现对酰胺化位点研究效果的提高,该方法相比之前的方法有了不错的提高。在本文中,提出了一种集成学习算法,stacking算法来进行实验。将高质量指数、氨基酸位置特异性倾向、K间隔氨基酸对相关性三种特征提取方法获得的特征相结合,经过特征选择后分别训练支持向量机、决策树、朴素贝叶斯模型,用改进的K间隔氨基酸组成、氨基酸因子两类特征经过特征选择后分别训练相应最优支持向量机模型,经过上述实验后一共获得五个模型,使用stacking算法将这五个模型作为基模型,利用五折交叉验证获得5维的特征来训练一个逻辑回归模型。最终得到了一个具有不错泛化能力的模型。该方法不但能够将多类特征信息使用到,而且还通过不同类型的分类算法,将不同分类器误分类的特征空间通过其他分类器进行修正,最终获得最好的效果。最后,该模型在独立测试集上能够取得很好的效果,其中敏感性为93.3%,特异性为97.8%,精确度为96.9%。实验结果表明,本文提出的方法相比其他方法有了提升。
其他文献
1,2,3-三氮唑衍生物具有独特的性质,是众多药物和材料的核心结构,其传统合成方法是通过1,3-偶极环加成反应。近些年,并环型1,2,3-三氮唑衍生物在医药、农药和材料等领域中已获广泛应用,该类化合物的合成有着重要的研究意义。本论文利用碳-氢官能团化方法,通过选择性碳-碳偶联构建并环型1,2,3-三氮唑衍生物,主要内容如下。论文第一章主要综述了近几年来并环型1,2,3-三氮唑衍生物的研究进展和现状
保障房的建设具有很强的保障性和公益性,引入公私合作(Public-private partnership;PPP)模式可以充分发挥政企双方优势,增强我国保障房建设的长期性和稳定性。但是,我国的PPP模式发展时间较短,各项法律法规发展不完善,加上保障房的建设和运营周期长,不确定因素大,政府部门作为单一的监督主体在监管上面临巨大的挑战,在一定程度上也阻碍了PPP模式的发展与应用。本文的重点探究在保障房
具有高离子电导率和碱稳定性的聚苯并咪唑阴离子交换膜(AEMs)一直是AEMs燃料电池的研究热点。本研究对聚苯并咪唑(PBI)进行了一系列改性,以制备具有较高离子传导率和耐碱性等综合性能较好的阴离子交换膜,研究内容主要分为以下三点:1、设计了一种大体积单体四苯基对苯二甲酸(TP),通过微波缩聚合成了一种新型的空间位阻较大的非平面结构聚合物mPBI-TP-x,随后对其进行一系列烷烃碘化物的二烷基化反应
从古至今,翻译活动总是应社会经济文化发展的需要而产生,尤其是在世界全球化的今天,新概念新技术的传播更是离不开翻译,从而推动某个领域的整体发展。在中国人口老龄化程度加
本文根据层序地层学、地震地层学、构造地质学、沉积岩石学、数学地质等多个学科理论,充分利用了工区录井、地震、测井等资料,完成了层序格架建立、地震构造解释、沉积微相分
纳米氧化铝(Aluminum Oxide Nanoparticles,Al2O3-NPs)是生产最多应用广泛的纳米材料,大量Al2O3-NPs进入空气,被吸入人体内,这需要重新评价经鼻Al2O3-NPs暴露的毒性,特别是孕
程式语指固定或半固定的多词短语,近年来受到学者越来越多的关注。学界普遍认为,使用程式语可以提高语言的流利度。然而,对于程式语是如何提高语言流利度的深层次的语言机制
港口服务是港口企业向运输经营人和货主或其代理人提供货物装卸、堆存仓储、租赁场地和设备以及其他有偿服务产品活动的过程。港口企业所发生的能耗、修理、人工、折旧等一系列费用都应当作为港口企业的生产成本。随着现代港口所处竞争环境的巨大变化,传统成本控制系统渐渐暴露出局限性,成本控制效果被削弱,大大降低港口企业成本管理的效率。传统成本控制所提供的成本信息准确性差,成本控制的操作重点确定缺少根据,成本控制的运
目的:探讨2,5-己二酮对VSC4.1细胞自噬的诱导作用及其分子机制。材料和方法:用含有15%FBS的DMEM预处理VSC4.1细胞24 h。然后将细胞分为四组:(1)空白对照组:不对VSC4.1细胞进
脂肪酶可以催化一系列反应,例如水解,酯化和酯交换,在化妆品以及食品等各个行业被广泛应用,因此占有巨大的市场地位。固定化酶克服了游离脂肪酶存在的费用昂贵、稳定性差和难于回收再利用等弊端,有利于降低生产成本及工业的连续化生产。众多研究表明,脂肪酶经固定化后,其温度耐受性和稳定性均会有所提高。基于此,本研究旨在开发一种核壳结构为基础的,温度耐受性良好的固定化酶的制备工艺。本研究对多种天然固定化载体(硅藻