基于机器学习的功能性短肽预测

来源 :天津大学 | 被引量 : 0次 | 上传用户:myhome1202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
功能性短肽是一类具有特定生物活性和功能的短肽。研究表明,许多功能性短肽可以应用到药物研发和癌症医疗之中,比如细胞穿膜肽和群体感应肽。这些功能性短肽的识别研究对于进一步了解其功能机制并将其应用于医疗领域尤为重要。目前已有许多研究工作致力于对功能性短肽的预测识别中,其中基于机器学习的方法可以完成更加快速准确且低成本的预测。在本项研究工作中,本人分别针对以下两种功能性短肽的基于机器学习的预测方法进行了深入的研究和分析。(1)本人首先对细胞穿膜肽的生物学重要性,数据库和现有的基于机器学习的细胞穿膜肽预测方法进行了全面综述。为了对现有的公开可用的细胞穿膜肽预测服务器进行总结和评估,本人使用两个基准测试集对来自六个预测服务器上的12个预测模型行了一项比较研究。测试结果表明,KELM-CPPpred预测服务器(KELM-Hybrid-AAC模型)可以提供更好的预测性能。此外,通过长度依赖性分析,现有的预测工具对于氨基酸长度20至25的肽序列进行细胞穿膜肽预测的结果更为准确。这一研究发现对于人为设计细胞穿膜肽的研究提供了一定的借鉴意义。(2)本人提出了一种基于随机森林算法的群体感应肽预测模型QSPred-FL。本人首先对实验使用的基于序列的特征提取算法进行了全面的介绍。为了更有效地使用现有的特征提取算法,本研究使用了一种特征提取策略和两步骤的特征选择策略,该策略以监督方式自动从现有特征算法中学习最具区分性的特征。基准测试结果表明,QSPred-FL能够实现很好的预测性能。此外,本人已经建立了一个用户友好的Web服务器,该服务器可用于检测大规模蛋白质组数据中的群体感应肽,可在http://server.malab.cn/QSPred-FL上访问。希望该工具能有助于对群体感应肽的高通量预测和重要功能机制研究。
其他文献
建筑能耗占全部能耗的32%,开关窗对建筑能耗的预测十分重要,此外,对自然通风的建筑物来说,开关窗对调节室内空气质量也起着至关重要的作用。而开关窗的人行为受多种驱动因素影响,性能优异的开关窗模型有助于提高模型的预测正确率,帮助研究者更好地预测建筑能耗。因此,为了更好地了解居住者何时打开/关闭窗户,构建一个能够预测居住者开窗行为的模型是很有必要的。当前,随着人工智能的火爆,很多研究者使用了各种机器学习
学位
报纸
随着能源危机的不断加剧和建筑能耗的不断增长,对于全社会能耗而言,建筑能耗约占总能耗的20%左右,因此,建筑节能在可持续发展战略中至关重要。而居住建筑作为人们生活中必不可少的场所,人们对居住建筑内舒适性要求的提高导致了相应能耗的增加,因此,控制居住建筑能耗已成为节能减排政策中重要的组成部分,而提前进行未来居住建筑能耗预测,有利于政府制定政策进行宏观调控,也有利于社会节能技术的进一步提升。为预测未来能
学位
随着我国经济社会快速发展,城市河流的水污染问题也在不断加剧。受污染河水的生物净化是应用最为广泛的河道净化方法之一。氮素污染物是引起河流富营养化的重要因素,因此高效脱氮是河水生物净化的研究热点之一。然而实际河水中很难同时满足传统生物脱氮过程中的好氧和缺氧条件,因此在好氧条件下既能进行硝化作用又能进行反硝化作用的异养硝化-好氧反硝化菌引发了广泛关注。目前利用异养硝化-好氧反硝化进行脱氮研究的报道大多是
学位
将城市污水进行再生利用是有效节约淡水资源、减少污水排放的有效措施。而磷作为二级出水中最丰富的污染物之一,如果不进行深度处理来严格控制排放量,将导致地表水富营养化的发生。此外,传统的水处理工艺难以去除水中的药品与个人护理品(PPCPs),这些PPCPs排放到环境中将会对人体健康及生态环境造成严重的危害。本文针对某再生水厂混凝气浮-超滤-反渗透各再生水工艺单元中总磷(TP)、COD和七种PPCPs进行
学位
三氯乙烯(TCE)是污染场地中一类常见的有机污染物,已被我国列入有毒有害污染物名录。TCE在地下水中具有较强的迁移能力,且难以自然降解,对地下水环境安全和人体健康存在威胁,亟需有效的修复技术来处理地下水中TCE污染。零价金属已被证明可用于污染物还原降解,其中,零价镁(ZVMg)作为一种还原能力较强的修复剂,已有研究证明其在有机溶剂体系中能降解多种有机污染物,但直接利用ZVMg降解水溶液中TCE的研
学位
<正>在北纬30度线上,有许多奇特的地方,如大西洋上的百慕大三角区、埃及大沙漠中的金字塔、世界上最深的海沟马里亚纳海沟和最高的山峰——珠穆朗玛峰等等,被称为"江南第一古县城"的慈城也恰恰在这个位置上。
期刊
随着化石能源的不断消耗,人们对于清洁能源的需求日益迫切,能源的储存与利用已经成为研究热点。储存与利用能源的同时兼顾环境的可持续发展是当今人类追求生产力发展与环境生态可持续的重要课题。超级电容作为一种潜力巨大,环保高效的储能设备,近些年来持续受到研究与关注。生物质废弃物每年产量巨大,利用生物质制备的生物炭材料在众多领域得到了普遍应用。其中生物炭用于超级电容的电极材料近年来受到广泛关注。本文利用KOH
学位
目前,机器学习技术已经深深扎根于人们的日常生活中,并且已经应用到几乎所有的应用领域。然而,构建一个高质量的机器学习模型是一个迭代、复杂、耗时的过程,同时这个过程需要大量的专家知识去尝试各种算法和技术。随着现实生活中数据量的不断大幅增长,人们已经认识到纵使知识渊博的数据科学家也无法应对这些挑战。因此,自动构建良好的机器学习模型是至关重要的。在最近几年时间里,一些技术和框架被引入来解决机器学习领域中自
学位
分布广泛、储备丰富且清洁无污染的太阳能已经成为能源开发利用热点,然而光伏在发电过程中温度较高,使得硅基光伏板发电效率及使用寿命受到了较大影响。辐射冷却技术的迅速发展使得廉价、环保且不受时间和气候限制提供冷量的冷却散热技术得以实现。辐射冷却与光伏发电技术相结合将综合两者的优势,为提高光伏发电效率及使用寿命提供一个新的途径。针对如何使光伏板温度保持在最佳温度,本文建立了基于辐射冷却的光伏间接冷却实验系
学位