论文部分内容阅读
蛋白质局部二级结构的建模与比较是生物信息学的中心问题之一。任何关于蛋白质功能的思考与讨论都需要围绕蛋白质的结构进行展开。在以往的研究中常借助空间坐标对蛋白质的三维结构进行描述,但由于数据较多,利用传统算法提取的二级结构几何信息相对于整体而言是不全面的。本文采用对偶四元数,针对蛋白质的二级结构建模与比较提出两种方法。 在蛋白质二级结构建模中,将对偶四元数这一算法应用其中。算法以当前肽平面为待拟合平面,下一肽平面为匹配平面,利用对偶四元数统一表达相邻肽平面之间的旋转和平移,构造两个平面的最小二乘拟合方程,并对系列拟合方程进行叠加,求取对偶四元数序列,实现蛋白质局部二级结构的拟合。并在此基础上提取蛋白质二级结构几何信息特征量,设定阈值,实现蛋白质螺旋的检测。通过对SCOP数据库中的100个蛋白质进行α螺旋检测,得到91.3%的精度结果。由此验证了应用对偶四元数于蛋白质局部二级结构描述与建模的简洁性与高效性。 在结构比较方法中,结构相似的显著性比较常常由相同结构的残基数目及蛋白质间均方根偏差RMSD的分数来衡量。由于计算过程复杂,本文提出蛋白质结构比较的对偶四元数距离方法。算法首先利用对偶四元数对两蛋白质进行结构配准,将提取的几何特征参数及三维坐标数据拟合到对称正定矩阵中。再将对称正定矩阵转换为对偶四元数的形式,利用对偶四元数之间的距离来度量两个蛋白质局部二级结构的相似性。通过三组实验,从不同的蛋白质数据和算法分别验证本方法的可行性与有效性。选取十组较难识别的蛋白质进行结构比较,其匹配精度与传统方法相比平均提高了1.6%。通过各项实验表明对偶四元数距离方法更易表达不同蛋白质之间的结构差异,计算方法更简便,比较结果更精准。