基于深度学习的蛋白质残基相互作用预测

来源 :苏州大学 | 被引量 : 5次 | 上传用户:berry909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
残基对的相互作用描述了蛋白质三维结构中一对残基的空间距离关系,相互作用的残基对对维护蛋白质结构的稳定起着重要作用。蛋白质中所有残基对的相互作用关系确定了蛋白质三维结构的二维拓扑,所以得到准确的残基对相互作用关系对蛋白质三维结构预测有重要意义。残基对相互作用预测,特别是长范围残基对相互作用预测的准确率一直很低。这主要是因为残基对特征与残基对相互作用的高度非线性,另外残基对正负样本比例的严重失调也降低了模型的泛化能力。本文研究了基于双向递归神经网络的深度序列模型以及减轻样本比例失调影响的训练算法。双向递归神经网络模型不仅可以接收变长的蛋白质序列特征,而且它在处理残基特征的时候也不需要指定滑动窗口大小,但滑动窗口却是普通浅学习方法所需要的。本文的训练算法在控制正负样本比例的同时,动态地选择输入给分类模型的样本。深度神经网络通过大量非线性变换把原始特征转换为高级特征,这种变换很适合残基相互作用预测这样的应用问题,但深度神经网络由于包含多层神经网络又会使超参数的选择成为难题。本文基于Hyperopt超参数优化框架实现了深度序列模型的并行超参数优化。通过快速的并行搜索,我们找到了一个与人工花费大量时间搜索到的模型不相上下的模型。这个模型在多个测试集上获得的中范围残基相互作用预测准确率超过其它方法10%以上,在长范围残基相互作用上的预测结果和当前流行方法不相上下。
其他文献
雾化渲染技术是3D实时图形渲染技术重要分支之一,也是高级3D场景渲染特效的支撑技术。然而,当前很多3D图形引擎和3D游戏引擎中的场景雾化渲染主要采用比较传统的雾化渲染方法
随着互联网的飞速发展,近年来电子商务得到了迅猛发展,交易数据激剧增加,即使采用目前最有效的Hadoop、Spark等数据处理技术也仍然存在不少问题,例如一些在评测集上效果好的
自Internet诞生,搜索引擎逐渐成为人们获取信息的主要方式。然而,随着互联网的高速发展和网络用户需求的不断提高,传统搜索引擎如Alta Visa、Google、Yahoo等越来越呈现出一
指纹识别技术虽然已日渐成熟,但实际上,作为指纹识别的核心技术仍然存在许多尚未解决的难题,尤其是残缺,污损指纹图像的识别不能令人满意。因此,针对目前国内外研究现状和应
随着网络技术的发展和不同形式的海量数据的积累,许多企业内部的商业数据被存储在不同的关系数据库中,运行在不同的开发平台和操作系统上,构成异构系统。因为XML已经成为Web
万维网的诞生改变了人们彼此交流方法以及商业运作的模式。随着万维网的飞速发展和广泛应用,Web上的信息变得愈来愈膨大,在这前提下,Web信息搜索系统也变得越来越重要。传统
随着信息技术的发展,越来越多的应用系统需要处理时态信息。传统的数据库系统已经不能满足用户对时态信息处理的需求,于是时态数据库技术就成为新一代数据库研究重点领域之一。
Web服务发展已相对比较成熟,如何有效地自动组合互联网的Web服务以完成复杂的功能则成为人们新的研究热点。语义网被称作“下一代Web技术”,语义Web服务则是融合了语义Web技术
人脸图像反映了重要的年龄信息,人脸年龄估计有着重要的研究意义和应用价值。对人脸年龄估计进行深入探索,将会对模式识别、人工智能、机器人等领域的研究起到巨大推动作用。
由于以关键帧形式手动编辑计算机角色运动要求对真实人体运动特征有深入的理解,并且编辑过程过于繁琐,而基于物理力学的计算机角色运动合成方法生成的运动数据真实性较低,再