基于相关向量机的蛋白质相互作用预测研究

来源 :中国矿业大学 | 被引量 : 3次 | 上传用户:greatspy_52
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质相互作用在生物体的许多细胞过程中发挥着重要的作用,蛋白质相互作用知识对研究各种疾病的发病机制与治疗、生命活动的分子机制都具有十分重要的意义。因此,研究和开发有效的计算方法来预测和分析蛋白质相互作用显得尤为重要。本文围绕基于计算方法预测蛋白质相互作用的两个重要方面:特征提取方法和分类算法展开研究。主要创新点如下:(1)基于蛋白质序列特征提取方法的研究。提出一种基于局域蛋白质序列PSSM矩阵编码的串行多特征融合特征提取方法。该方法通过局域编码捕获序列上连续的和间断的蛋白质相互作用信息;通过串行多特征融合实现序列中蕴含的多种关键特征信息的整合;通过在yeast和human数据集上与其它特征提取方法的实验对比分析,证明了本文提出特征提取方法的有效性。(2)基于蛋白质相互作用有监督预测分类器的研究。提出一种基于灰狼优化和K折交叉验证的组合核相关向量机分类算法。该算法通过灰狼优化和K折交叉验证的智能寻优算法得到RVM核函数宽度的最优解;通过建立基于局部高斯核和全局二次多项式核的组合核函数,不但克服了RVM在大样本数据集上单一核函数运行模式预测精度低的缺陷,而且充分考虑了蛋白质相互作用发生位置的局部性和全局性的特定特征;通过在yeast和human数据集上,提出的核参数智能寻优算法、组合核RVM和构建的预测模型分别与其它智能寻优算法、基于单核的RVM和其他预测模型的实验对比分析,证明了本文提出的有监督分类算法的有效性。(3)基于蛋白质相互作用半监督预测分类器的研究。提出一种基于AP聚类与Renyi熵融合的自训练半监督相关向量机分类算法。该算法通过AP聚类分析与Renyi熵共同决定无标签样本的标签类别,极大降低了噪声数据对分类器预测精度的影响;通过将置信度高的无标签样本添加到训练集,用扩充后的训练集进行自训练迭代分类,构造出了性能最优的半监督分类器;通过在M.musculus、H.pylori和H.sapiens数据集上的实验验证,证明了本文提出的半监督分类算法的有效性。(4)设计开发了分别针对yeast和human数据集的有监督分类预测及M.musculus、H.pylori和H.sapiens数据集的半监督分类预测的蛋白质相互作用在线预测系统。
其他文献
上市公司会计造假正侵蚀着市场经济的基石--诚信原则,给我国经济持续发展带来严重的负面影响.我国上市公司会计造假具有可能性,从动力和压力两个维度形成其内在动因,但会计造
<正> 三、从满溯事变至日华事变爆发(昭和六年九月——十二年七月)(1931.9——1937.7) 苏联于十月革命后,一度由中东铁路撤手,持极其慎重的守势态度,根据日本对满洲的统治与
随着人们闲时、闲钱和闲情的增多,尤其是休闲阶层即中间阶层的不断扩大,休闲已成为一种普遍的社会现象.然而,娱乐休闲领域鱼龙混杂,沉渣泛起,休闲产业发展幼稚,给小康社会的
文学创作作为一种主体的建构性艺术活动,是一种心象性的活动,创作主体须具备各方面的素质.这就要求我们要运用多元论观点审视文学现象,方能对文学进行全方位的理论探讨.周国
普通话水平测试"说话"项的测评争议较大.<湖南省普通话水平测试评分细则>"说话"项的评分标准存在某些欠妥之处,突出表现在某些概念的界定与阐述、定量控制与定性特征的吻合度
为改善我国创业投资发展的法律环境,在立法上似可借鉴国外法律,承认有限合伙。然适用于创业投资企业的有限合伙,与普通民商事主体的有限合伙在制度、规范、要求上差异很大,其
目的对舒适护理在老年性哮喘患者护理中起到的作用进行讨论。方法将我院诊治的32例老年性哮喘患者作为对象,在其治疗期间出现的心理、睡眠、体位、饮食等方面的问题采取相应