【摘 要】
:
蛋白质在生命系统中发挥各种重要的作用,参与包括催化代谢反应、刺激反馈等在内的各种生物过程,这与它独特的天然结构细节具有密切的关联。可测定天然结构的实验技术由于其耗时耗力且完全无法跟进蛋白质测序技术发展的脚步,从而产生仅通过氨基酸序列来预测目标系统三级结构的计算方法。作为结构预测中应用更为广泛的从头计算方法,所有可能结构填充的构象空间的高维性和表征任意一个构象势能状态的能量函数一直以来都是两大研究壁
论文部分内容阅读
蛋白质在生命系统中发挥各种重要的作用,参与包括催化代谢反应、刺激反馈等在内的各种生物过程,这与它独特的天然结构细节具有密切的关联。可测定天然结构的实验技术由于其耗时耗力且完全无法跟进蛋白质测序技术发展的脚步,从而产生仅通过氨基酸序列来预测目标系统三级结构的计算方法。作为结构预测中应用更为广泛的从头计算方法,所有可能结构填充的构象空间的高维性和表征任意一个构象势能状态的能量函数一直以来都是两大研究壁垒。针对这两大挑战,本文基于基本的进化算法研究了蛋白质构象空间的搜索方法,并结合机器学习技术提出了基于多层次信息融合的蛋白质结构预测方法。具体工作如下:第一,基于优化搜索的诱饵构象评估管道技术Evo P。针对蛋白质构象空间高维且连续这一本质特性,为了提高诱饵结构采样的效率和结果构象集的质量,提出了一种优化搜索的构象评估策略管道技术。该管道涵盖了种群更新、构象空间优化和片段库动态优化三个策略,为基于残基分布与二级结构的构象重采样算法和基于多层次信息融合的蛋白质结构预测方法提供高质量的采样起点,有助于减小搜索空间并覆盖尽可能多的低势能区域。第二,基于残基与二级结构的构象重采样算法SDSS。针对进化计算领域用于解决复杂搜索和优化问题的随机搜索算法的易收敛问题,通过粗粒化和片段替换技术的结合,本文基于氨基酸序列分布、残基二级结构类型和构象的结构多样性构建了多个离散的评估模型,并提出了一种构象重采样算法SDSS,在Evo P的框架下以实现减小目标系统构象空间和提高更高质量诱饵结构采样能力的目的。实验表明,通过与主流的从头计算协议Rosetta和QUARK对比,该算法在10个目标系统上获得的第一个聚类结构的平均TM-score结果比Rosetta和QUARK方法分别高了2.6%和3.7%,即更接近于实验测定的天然态结构。第三,基于多层次约束的蛋白质结构预测方法MULFOLD。针对氨基酸序列中各位置残基间潜在的距离约束和相互作用信号,在DNcon2网络架构的基础上,通过选择性的特征训练设计了优化的接触预测模型Dncon X并基于相互作用约束构建了评估模型。同时又在种群的进化过程中设计了一种复交叉策略,从而根据构象的拓扑吻合度分数,实现不同交叉阶段之间的切换,并结合设计的不同评估模型指导片段库的生成与优化,在Evo P的框架下提出了基于多层次信息融合的蛋白质结构预测算法MULFOLD。实验结果表明,MULFOLD在三种比较的从头预测方法中获得了测试集中最佳的平均TM-score与mean-RMSD结果,以及最多的TM-score超过0.5的目标数,在20个PDB目标上获得的mean-RMSD和LRMSD结果分别优于Rosetta和0.49(?)和0.52(?)。通过多个层次的先验知识所形成的MULFOLD算法在种群迭代过程中既避免了过采样,又提高了迭代的效率,从而提高了输出的预测诱饵集与天然态结构的接近程度,对能量函数的低精确性起到了很好的弥补作用。
其他文献
传统汽车的加速普及造成了日趋严重的能源消耗和环境污染问题,电动汽车作为一种环保的交通工具,是未来汽车发展的主流方向。动力锂电池荷电状态(State of Charge,SOC)是电池能量和功率计算的至关重要的状态参数,其估计(或估算)准确性对于优化整车能量控制、防止过充电和过放电、电池安全防护具有重要意义。基于等效电路模型的方法是效果比较好的SOC估计手段。然而,电池等效电路模型的不确定性和外部噪
近年来,随着移动互联网的大范围普及以及各类App的火热推广,人们开始使用各类电商平台和社交平台进行日常的消费和社交活动,并在平台上发布评论。用户评论以文字形式为主,并且往往包含了用户的情感倾向和主观意向,分析这些评论中包含的情感倾向,对改进平台服务质量有着积极的作用。与其他模型相比,基于神经网络的深度学习方法极大地提升了文本情感分析的准确率和鲁棒性,成为了当前的研究热点。然而,许多基于CNN的情感
随着能源危机和环境问题的日益加剧,新的驱动技术和替代燃料正得到越来越多的研究和利用。纯电动汽车以其结构简单、高效率、行驶阶段无污染的优势,备受市场用户和政府的青睐,成为近年来的各大厂商的必争之地。本文以某款纯电动汽车开发为背景,对整车动力系统进行匹配设计,开展整车动力性和能量流试验,基于GT-Suite仿真软件搭建整车性能仿真模型,研究不同环境因素对再生制动及整车能效贡献的影响并进行合理有效的评价
随着健康意识的提高和药物生产的增加,抗生素已广泛应用于医疗保健,畜牧业和水产养殖等领域。然而,大多数抗生素结构较稳定,它们不能被人体或动物体完全代谢,以致于通过各种形式不断被排入水中,对生态环境构成威胁。因此,有必要开发一种经济、高效且环保的方法来处理环境中的抗生素,其中太阳能光催化技术在这方面具有巨大的应用潜力。作为Aurivillius氧化物家族的一员,以Bi2O22+和CO32-层交替存在为
客家是中原汉族在历史进程中数次南下与当地土著不断冲突与融合的产物,赣南作为客家民系迁徙的第一站,也是客家民系发源地和主要聚居区。传统民居是传统建筑范畴内的一种建筑类型,是以历史传统沿袭而来的建造工艺技术,使用传统民居体系的材料所建造的具有当地传统形式的建筑物,但伴随着现代居民生活生产水平的不断提升,大量传统民居在居住功能、与当地产业发展方面均产生诸多矛盾,因此,运用现代适宜性技术对赣南客家传统民居
电击作为一种惩罚性刺激,在各类模式生物的研究中有着广泛的应用场景,例如果蝇的应激、学习和记忆等多种行为学研究中,电击都是必不可少的实验条件。然而,目前我们还不是很清楚电击对果蝇基因表达和生理生化方面的影响。本文以转录组测序数据的生物信息学分析为切入点,通过对转录组数据的个性化分析,结合实时荧光定量PCR实验等技术,对电击应激源进行深入探究,并与不同应激源的数据综合分析,探究不同应激源对果蝇影响的异
皮肤黑色素肿瘤是当前世界上最常见的重症,是早期被发现可治愈一种疾病。据不完全统计,每年有数千人不幸患病。目前,黑色素瘤的主要诊断方法是基于皮肤镜的人工目视观察,但受医师医技水平和经验的影响,诊断准确率约有75%~80%左右,且诊断效率低。因此,开展黑色素瘤早起发现和精确诊断具有现实意义。论文比较研究了国内外针对黑色素瘤皮肤镜图像的识别诊断方法,提出了一种融合元数据和图像数据的多模态神经网络算法。元
金属腐蚀能够极大地改变金属材料的物理化学特性,对环境和经济具有重大影响,而传统涂层腐蚀防护技术存在涂层使用寿命偏短的问题,这限制了涂层材料的应用和发展。近年来,具有主动防护能力的智能防腐涂层因其能够像生物组织一样进行自我修复,可以实现对金属的长效防腐,因此逐渐受到研究者的关注。本论文设计和制备了以金属有机框架材料(ZIF-8)为纳米容器的多功能刺激响应控释系统,并将其应用于水性环氧涂层中来制备智能
为研发一款高效结构拓扑优化软件,本文以完全自主实现拓扑优化并最大化求解效率为目标,基于变密度法的相关理论知识,从实际商业软件开发的角度出发,采用C++开发了覆盖拓扑优化全流程的三维拓扑优化软件。本文主要研究内容如下:首先对与三维结构拓扑优化问题,本文充分研究了基于SIMP的材料插值模型和棋盘格、灰度单元等现象,明确了后续软件开发过程中需要解决的问题;并对优化流程中有限元求解与拓扑优化求解的数学原理
工程陶瓷是典型的难磨材料,在磨削过程中工件表面的磨削温度高,磨削温度在一定范围内能使陶瓷工件表面材料以塑性变形去除的比例增加,有利于提高表面质量,但磨削温度过高易出现磨削裂纹等加工缺陷。到目前为止,热电偶法能直接测量陶瓷工件表面的磨削温度,但热电偶法测量磨削温度较困难,同时会破坏陶瓷工件影响测量精度等。ANSYS有限元仿真技术能借助计算机基于热传导理论仿真工程陶瓷的磨削温度,能获得陶瓷工件在磨削过