基于支持向量机的蛋白质分类研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:shanwq1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的顺利进展,越来越多的蛋白质序列被测定出来;而通过实验确定其结构与功能的蛋白质序列则相对较少,且两者之间的差距有迅速扩大的趋势。由于通过实验确定蛋白质的结构和功能费时、费力、费财,且实验中可能还会遇到一些目前无法解决的困难,因此探索利用理论及计算方法来研究蛋白质结构和功能具有重要意义。本文从蛋白质的一级序列出发,研究了蛋白质的结构、功能分类预测,其主要贡献如下: 1.提出一种新的组合分类思想,即将氨基酸组成成分、自相关函数二种特征提取法与支持向量机恰当组合,首次对蛋白质同源二聚体和非同源二聚体进行分类研究,并与国际上现有的Garian方法进行了对比。在10CV检验下,本文方法的分类总精度比Garian方法最大可提高17.1个百分点。 2.提出二种新的特征提取法,并引入以前已有的二种特征提取法,与支持向量机和不同的分类策略,进行恰当的组合构成分类系统,首次对蛋白质同源二聚体、同源三聚体、同源四聚体和同源六聚体进行分类研究。结果表明整合了氨基酸残基序列顺序信息的三种特征提取法,其分类能力均好于氨基酸组成成分特征提取法,尤以我们提出的加权自相关函数特征提取法的分类效果最好,其分类总精度可比氨基酸组成成分特征提取法最大可提高6.39个百分点,比Chou的特征提取法提高2.41个百分点;采用“一对一”策略的分类能力明显优于“一对多”策略,其分类总精度最大可提高17.69个百分点。 3.一种新的组合分类方法,即将自相关函数特征提取法和支持向量机、以及本文提出的“改进的唯一的一对多”分类策略恰当组合,应用于蛋白质折叠子分类研究。结果显示:对于独立测试样本,自相关函数特征提取法的分类总精度比氨基酸组成成分特征提取法,大约可提高7个百分点;“改进的唯一的一对多”分类策略优于“一对多”策略,其独立测试和5CV检验的分类总精度,比“一对多”策略最大可分别提高约18和12个百分点。 4.引入加权思想,以一种新的特征提取法—加权自相关函数,表示蛋白质序列,并采用“一对多”、“一对一”分类策略对膜蛋白和亚细胞定位进行了分类和预测研究,结果有明显改善: 1).对于膜蛋白分类,在采用支持向量机算法及“一对多”分类策略下,加权自相关函数特征提取法的分类总精度为87.98%,比氨基酸组成成分特征提取
其他文献
目前正值加油站油罐防渗改造实施的主要阶段,根据设计院所做加油站防渗改造工程中不同类型项目的设计经验总结,在符合《汽车加油加气站设计与施工规范》GB50156-2012(2014年
当代大学生是21世纪的栋梁,大学生素质的高低,决定着我国21世纪在国际竞争中的地位和我国社会发展目标的实现。因此,在第三次全国教育工作会议上通过的《中共中央国务院关于深化教育
本文对当前形势下居民普遍持有的基金风险收益状况及其最新发展动态作出客观分析,进一步指出证券投资基金是最适合广大居民参与的高效益金融投资工具,选择基金投资是广大居民有
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
<正>2016年5月13日,中国石油和化学工业联合会、中国氯碱工业协会在银川主持召开了宁夏新龙蓝天科技股份有限公司"低汞触媒生产与废汞触媒回收一体化示范项目"专家认定评审会
印刷业在图文信息复制、存储及传播中发挥着重要作用,长期以来推动着人类的文化传播、知识传承及文明进步,是轻工、文化及国防科技领域的重要载体,其产品广泛遍布于人们生活