论文部分内容阅读
预测蛋白质相互作用的位点在理论和实践上都具有重要的意义。蛋白质间的相互作用在许多生物过程中扮演着重要的角色,例如,免疫反应、酶的催化、信号传导等。理解一个蛋白质的生物功能的一个重要环节就是识别与其相互作用的蛋白质或者配体。蛋白质相互作用位点的预测对于突变设计和蛋白质相互作用网络的重构都是至关重要的。蛋白质科学的重要目标之一是理解蛋白质相互作用的机制和预测蛋白质表面的相互作用位点。
由于实验确定的蛋白质化合物及蛋白质配体化合物的结构依然相当少,而且生物学实验的方法过于费时费力,所以预测蛋白质相互作用位点的计算方法就日益重要起来。特别是近年来,许多具有优良性能的智能算法的提出,使得计算方法预测蛋白质相互作用位点的工作取得了很大的进展。
在生物信息学中,支持向量机已经成为解决模式识别问题的重要工具。在本文中,我们首先对蛋白质相互作用位点预测的发展历程进行了回顾;并对支持向量机及其在生物信息中的应用作了简单的介绍;最后,针对现有的低效率预测问题,我们提出了一种以支持向量机为分类器,以邻近残基的序列谱和可及表面积为输入数据来预测蛋白质相互作用位点的方法。我们从26个蛋白质复合物中提取出35个蛋白质分子作为训练和测试的数据集SVM-data。为了检验方法的预测效果,我们运用两种方法(输入数据为序列谱+ASA的方法和输入数据只有序列谱的方法),分别对数据集SVM-data中的每个蛋白质进行计算。计算结果显示我们提出的方法比输入数据仅有序列谱的方法更能有效地预测出蛋白质相互作用的位点。