基于F-score和mRMR的蛋白质热点预测方法研究

来源 :武汉科技大学 | 被引量 : 1次 | 上传用户:peng737
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质相互作用热点预测是功能蛋白质组学中主要研究内容之一。Clackson观察hGH与hGHbp结合时发现极少数残基释放大量的能量,由此引起研究者兴趣。之后研究者将这些极少数的发挥关键作用的氨基酸残基定义为热点残基。热点残基不是均匀分布于蛋白质相互作用的结合面,而是聚集在一起形成“热区”。  热点残基的预测是一个复杂的问题,涉及蛋白质的结构、序列以及结合面等方面。已有的热点残基的预测方法取得了一些成果,但是由于对决定热点残基的生物学特征没有充分的理解,热点残基预测结果还有改进的余地。基于特征的方法结合机器学习算法避免传统方法实验周期长、计算代价高以及不能大规模应用的缺点,是一个新兴的研究方向。本文提出了一种基于多种特征预测蛋白质热点残基的方法,首先,提取了多种与热点相关的蛋白质序列与结构特征,然后利用了F-score和mRMR选择蛋白质氨基酸理化属性的加权疏水性、加权残基接触数、结构属性溶剂可接近面积和残基突出指数等特征,最后采用机器学习SVM算法对选定的数据作预测分析。  实验结果表明,本文提出的热点残基的预测方法达到了预期的预测精度。与已有的方法对比,所提方法在相同的数据集上包括训练集以及测试集都达到了预期目标,体现了提取特征的有效性。本文工作为蛋白质相互作用热区预测打下了较好的基础。
其他文献
光束在通过具有Kerr非线性的介质时将引起介质的三阶非线性极化。在入射光束预先受到小尺度散射物调制的情形下,这可能引起对激光系统的安全运行具有很大的威胁性的高强度热
随着军事变革的发展,军队设备及装备正由机械化逐步向信息化推进。军队信息化建设直接关系到军队战斗力的生成,也是在未来战争中实现能打仗、打胜仗必要条件。通过推进信息化
在信息化高速发展的现代社会,工作流技术在计算机领域内的地位变的越来越重要。在复杂的系统中,各项任务将由工作流系统调度相应的资源来处理,使得整个系统的效率得到提高。工作
信息技术的发展为制造业带来了活力,在制造业信息化浪潮中,MES(制造执行系统)的出现填补了制造企业底层过程控制系统与上层企业资源计划系统间的信息鸿沟。然而,传统的MES软
城市安全生产监管信息系统(City Safety Production Supervision Management System, CSPSMS)涉及到安委办、安监局、质监局、建交委、民防办、交警支队、消防支队和街道安全
在这样一个信息爆炸以及互联网飞速发展的时代,云计算和云存储极有可能成为未来最主要的计算和存储模型和服务模式但目前云存储服务的应用,特别是在企业中的应用,还比较有限其中
随机数序列在科学研究和工程技术等方面得到了广泛的应用,其作用越来越重要。现场可编程门阵列(Field Programmable Gate Array, FPGA)技术为集成随机数发生器提供了条件。现
对大规模无线传感网络的研究是一项具有挑战性的课题。其中对已经部署运行的大规模传感网络进行软件更新就是其中一项巨大的挑战。现实的传感网络应用通常需要部署成百上千个
智能交通系统(ITS)是以提高道路交通系统安全性,高效性为目标,采用图像处理、人工智能、嵌入式、传感器和模式识别等多种技术手段,解决交通拥堵、交通事故等问题。其中,车辆检测
随着人们对信息安全和可靠性要求的日益提高,身份识别成为信息安全领域中一个很重要的研究课题。然而,传统的证件、口令、密码等身份识别的技术存在易被复制、窃取、遗忘等缺陷