基于序列信息识别蛋白质中钙离子结合残基

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:xx63394965
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多重要的生命活动中,蛋白质功能的实现需要通过与配体相结合,钙离子就是一种重要的蛋白质结合配体。因此,识别蛋白质中的钙离子结合残基会对蛋白质功能的研究和药物开发提供重要的帮助。虽然利用实验手段测定蛋白质中钙离子结合残基的准确性很高,但是其时间和经济成本高昂。因此,通过理论计算的方法对大量蛋白质中钙离子结合残基进行高效率识别是目前研究蛋白质功能的重要手段之一。  本文基于序列信息识别蛋白质中钙离子结合残基,主要工作如下:  (1)建立了新的钙离子结合蛋白质数据集,包含277条序列相似性小于30%,分辨率小于3?的钙离子结合蛋白质链,共包含1801个钙离子结合残基。使用“滑动窗口”截取固定长度的序列片段,通过对不同长度序列片段识别结果的统计分析,最终确定以17个氨基酸残基为片段长度。  (2)依据钙离子结合残基生物学背景,对钙离子结合残基片段和非钙离子结合残基片段进行统计分析和残基理化特性研究,选取离散增量算法、矩阵打分算法和支持向量机算法对数据集set1中钙离子结合残基进行识别,其中基于离散增量值、矩阵打分值和自交叉协方差值的支持向量机算法获得最佳识别结果,使用五交叉检验,识别精度为75.0%,马氏相关系数为0.50。  (3)本文使用融合参数的支持向量机算法对钙离子结合残基进行了识别,并引入新的特征参数:中心模体。通过逐一向支持向量机中添加特征参数,分析了不同参数组合对算法识别能力的影响。同时为了进一步验证本文识别算法的普适性,本文整理了前人的钙离子结合残基数据集(set2,set3,set4)。对四个数据集的识别结果表现出相同的递增趋势,并最终均达到最佳识别结果。为了对比前人研究的识别结果,本文使用十交叉检验和独立检验对数据集set3和set4进行识别,并得到了好于前人的识别结果。  (4)本文建立了钙离子结合残基的在线识别页面,广大研究工作者可以通过本地浏览器访问该服务器页面获得蛋白质序列中钙离子结合残基的识别结果。
其他文献
啮齿类动物的胚胎干细胞(ESCs)与上胚层干细胞(EpiSCs)是建系来源不同的两大多能性干细胞。啮齿类动物的胚胎干细胞主要依靠LIF和BMP4来维持多能性状态,其具有体内外分化成三
当前新课程改革实验已经在全国全面展开,教学改革的宗旨是要打破束缚学生手脚的做法,把课堂还给学生,让学生成为学习的主人,学生成为课堂的主人,而有一些课堂仍然是与课改背
随着计算机技术的飞速发展,嵌入式系统将在人们的生产生活中发挥越来越重要的作用。一方面,ARM技术已经在当今的嵌入式微处理器领域中占据了领先地位,另一方面,结构清晰、源
体育是中职教育当中的主要教学内容之一,伴随着时代和社会的发展,对我们的教育工作也提出了越来越高的要求,新课程改革要求我们开展素质教育,培育学生的综合素质能力,在带领
一线城市房价的暴涨与狂欢让之前公众并不在意的“首付贷”清晰地浮出了水面,这一可以轻松划破央行购房个贷底线的金融创新工具不仅引来了管理层十分警觉的目光,更招徕了北京
高职院校是以就业为导向开展教学工作,因此在教学过程中应重视学生专业技能的培养.而如何使学生在学习过程中,形成良好的学习氛围,对高校管理工作提出新的挑战.因此,高职院校
在素质教育的倡导下,现阶段小学体育教学目标发生了很大转变,即从传统对学生体育技能、体育知识的培养逐渐转变为将德育渗入到体育教学当中,这不仅使学生的思考与学习能力得
论文在分析接入网网管汇聚端的基础上,采用数字集成电路自上而下的设计方法进行了汇聚器设计。在详细分析HDLC协议和SDRAM缓存规则的基础上,对汇聚器进行了功能模块划分;采用
随着MEMS技术的飞速发展,微悬浮转子式陀螺逐渐成为研究的热点和关注的焦点。不同于传统振动式陀螺,悬浮转子式具有高精度、高灵敏度等优点,而且排除了振动式微陀螺所固有的
在高中的物理学内容中,由于力学占据了很大的空间,所以无法推测力学在考试中占据了多大的比分.力学这个领域被分成很多类别.本文是从力学的摩擦力出发进行探究和学习的,探究