蛋白质动力学分子模拟及高效采样策略

来源 :南京大学 | 被引量 : 0次 | 上传用户:WZX10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质作为生物功能的主要承担者,吸引着物理、生物和化学等各领域的广泛关注。而分子动力学模拟因其能同时提供精确的结构和即时的动力学信息,成为了一种极为重要的蛋白质研究方法。然而在现有的计算能力条件下,相对准确的全原子分子动力学模拟很难达到典型蛋白质功能动力学所涉及的时间尺度,这一定程度上限制了它的应用。为了克服这种困难,人们发展出了多种高效采样策略来提高分子动力学模拟的效率,其中包括:1)通过对蛋白质分子做粗粒化近似来提高分子模拟的采样效率;2)基于统计物理学原理,发展分子模拟的加速采样方法。本论文对以上两种思路都进行了实践。一方面,我们在动态能量面理论的框架下构建了一套描述力学、化学等外部因素调控下的蛋白质别构和功能动力学的粗粒化模型,并用于研究典型信号蛋白钙调蛋白在疏水碳纳米管作用下的生物毒性机制和大肠杆菌粘附素的catch-bond效应的分子机制。该模型可用于研究分子马达、分子伴侣等各类蛋白体系的动力学过程。另一方面,我们也发展出了一套基于构象空间粗粒化来加速采样的算法。该方法可以让我们在不改变分子力场、不使用高温或偏置势的前提下加速构象采样,并有着良好的可移植性。另外,为了解决粗粒化模型精度较低的问题,我们还发展出了一套利用蛋白质氢交换实验数据来优化粗粒化模型的整合分子模拟方案。具体来说,我们的工作主要由以下四个部分组成:(一)疏水纳米粒子对钙调蛋白功能动力学影响的粗粒化分子模拟纳米物质在工业和日常生活中的广泛应用已经引起了人们对于其可能造成的生物毒性的担忧。越来越多的证据将纳米粒子的毒性和细胞信号通路的阻断联系在一起。在本工作中,我们通过研究疏水碳纳米管(CNT)对钙调蛋白(calmodulin/Ca M)的功能运动的直接影响来给出CNT生物毒性机制的一种解释。Ca M是细胞中最重要的信号蛋白之一,而它的信号功能依赖于钙离子调控的构象变化。通过粗粒化模拟我们发现,CNT改变了Ca M的构象平衡,使其从closed态转变到open态并失去感应Ca2+的能力。此外,CNT提高了Ca M的Ca2+亲和性,从而可能破坏细胞内的钙平衡。这些结果表明疏水碳纳米管不仅抑制了Ca M作为Ca2+感应器的信号传递功能,还将Ca M变为一种能与其他正常的Ca2+结合蛋白竞争Ca2+的有毒物质,揭示了纳米粒子生物毒性的一种新的物理机制。(二)大肠杆菌粘附素Fim H的catch-bond效应分子机制的粗粒化模拟一些研究表明,机械力可以作为一种重要的生物信号来调控各种分子和细胞行为。例如,大肠杆菌粘附素Fim H与其配体的结合强度会由于外力的作用而得到反直觉的增强,即所谓的catch-bond效应。这种效应对于细菌粘附以及大肠杆菌感染有着极为重要的作用。为了深入研究它的分子机制,我们在动态能量面理论的框架下构建了一套能够描述Fim H的catch-bond效应的粗粒化模型。相应的模拟结果很好地再现了catch-bond效应的主要实验现象,并提供了一个外力调控细菌粘附过程的完整图像。模拟结果还揭示了别构过程的双向耦合机制,即外力导致的配体结合强度的增加和配体结合导致的catch-bond效应的机械力阈值的降低。另外,我们还研究了结构域分离、构象变化和配体结合的路径,展示了多路径动力学对catch-bond效应的贡献。这些结果提供了机械力调控蛋白粘附过程的详细分子机制,加深了人们对于机械力作为信号调控生物过程的认识。(三)一种基于构象空间粗粒化的加速采样算法对于有着复杂能量面的系统,用分子模拟进行构象采样是一项比较困难的工作。这里我们基于构象空间的粗粒化,提出了一种新的加速采样方法。在该方法中,局部平衡区域将被粗粒化,即用轨迹在该区域的平均驻留时间和访问次数来表征该区域的采样数,并且该区域内将不再进行任何直接的动力学模拟。而通过更新访问数以及从该区域生成向外轨迹的操作,细致平衡条件可以得到满足。这种粗粒化操作还可以通过合并周围的收敛区域来进一步实现。当构象空间里所有物理区域都被局部平衡区域所覆盖时,全局平衡就达到了。为了测试该方法,我们将其应用于包含多个势阱的两个二维模型势和一个蛋白体系。相比传统的动力学模拟,我们的方法至少能提供3个数量级的效率提升,而和其他一些广泛应用的加速采样算法相比也有着相近的效率。另外,我们的方法还能捕捉到一些动力学信息。以上所有结果都表明,我们的方法能在不使用高温和偏置势的前提下,高效而准确地解决采样问题。(四)蛋白质氢交换的多尺度模拟方法在这个工作中,我们首先给出了一种基于粗粒化分子动力学模拟来得到氢交换数据的可行方法。通过将基于原子间相互作用的粗粒化模型和全原子结构重建算法相结合的方法,我们以一个合理的精度重现了蛋白质的氢交换实验数据。而在此基础之上,我们还发展出了一套基于氢交换实验数据的约束,通过迭代优化的策略来改进粗粒化力场的方法。以上结果表明,结合氢交换数据来优化蛋白质粗粒化分子力场是一种可行的整合分子模拟方案,并能帮助我们克服粗粒化模拟所面临的精度不足的瓶颈。
其他文献
气液搅拌流动主要特征是液膜上下剧烈震荡以及存在液滴夹带等流动情况现象,其流动特点实质上是气液相界面的不同演变特征造成。剪切稀化非牛顿流体搅拌流广泛存在于各个工业领域中,对于系统的安全和稳定运行有着重要的意义,但其相关研究较少。因此,有必要对剪切稀化非牛顿流体气液两相搅拌流的相界面失稳演变特性进行研究。本文基于Kelvin-Helmholtz不稳定性采用机理建模的研究方法,系统研究了剪切稀化非牛顿流
光通过光学器件或溶液时,会产生反射、透射、散射等光学现象,光学性能检测就是指对这些光学现象进行检测从而对待测样品的物理性质和化学性质进行分析。衍射光栅是一种重要的光学器件,其由微米/亚微米级的刻线构成。光栅存在多个衍射级次,各级次的角间距由光栅常数、即每毫米的刻线数决定,各级次的衍射效率分布主要由光栅微观槽型决定。精确测试光栅各级次的衍射角与衍射效率,对于评价光栅性能与制备工艺不可或缺。然而,不同
干涉是光场的波动特征之一,源自干涉原理的一系列光学技术是现代科技的重要组成部分,其中的全息技术是干涉应用的典型代表。普通摄影技术利用光学透镜的物像变换作用,只记录下物光场的强度(振幅)信息,由于相位信息的丢失,因而其失去了对物体进行三维成像的能力。全息技术是基于光波干涉,将物体的振幅和相位信息以干涉条纹图(全息图)形式记录下来,进而通过光学或数字过程重建出物光场的波前、再现出物体的三维图像。全息原
石墨烯具有丰富的物理、化学性质,在透明导电薄膜、半导体等领域极具应用前景。目前,化学气相沉积(CVD)法由于操作简单、价格低廉并且可以大规模制备出高质量的样品,被认为是最可能实现石墨烯未来应用的制备手段。然而,CVD石墨烯总是存在着褶皱,褶皱作为一种线缺陷,将降解石墨烯的性能,影响薄膜的宏观均匀性。因此,如何彻底消除褶皱,实现无褶皱、超平整石墨烯的大规模制备是该领域的一个重点也是难点。此外,CVD
神经形态计算旨在模拟生物大脑和感知神经系统的信息处理方式,构建一个能够自主学习和具备认知功能的超低功耗智能计算机。突触、神经元和感觉接收器是生物计算系统处理信息的基本单元。因此,神经形态计算硬件实现的第一步就是研制出具有突触、神经元或感觉接收器功能的神经形态器件。新型神经形态器件凭借单个器件就能实现复杂的神经形态功能,其中电解质栅晶体管(Electrolyte Gated Transistors,
偏最小二乘法判别法是被广泛应用的一种高维数据降维分类预测判别方法,但在实际中,该方法通常会产生难以解释的原始变量的线性组合。在本文中把判别纳入到回归的框架之中。提出了一种带有惩罚项的稀疏型偏最小二乘法,结合矩阵的奇异值分解提出了一种秩为一矩阵的近似方法和算法。提出该种方法的目的在于把高维数据的变量筛选和变量的线性组合同时合并到一个步骤之中。尽最大可能地找出原始特征中包含的有用信息,实现数据的降维。
经过近数十年的发展,基于平均场近似的单参考量子化学方法已可对数十乃至上百个原子的一般化学分子进行较精确的结构、能量与性质计算。然而,对于强电子相关体系,如共轭分子和过渡金属配合物,由于存在大量能量近简并的π、d或f轨道,计算时需要对这些轨道组成的活性空间进行精确对角化,其计算量随体系的增大呈指数增长,因此目前的传统多组态和多参考量子化学方法尚难以处理超过18个活性轨道的体系。密度矩阵重正化群(DM
在系统辨识问题中,建立待辨识模型是一个重要的步骤。模块化非线性系统具有模型结构简单的特点,采用不同静态非线性块和动态线性块级联而成,其优点在于将系统的动态静态特性相分离,可以很好描述实际非线性系统。且设计时变模块化非线性系统和切换模块化非线性系统更加全面描述实际过程中的非线性和时变特性。由于模块化非线性系统包含一定的输入非线性或输出非线性,为其辨识带来一定难度,而且复杂噪声环境下,辨识结果存在偏差
研究背景:肾脏纤维化是肾脏衰老以及慢性肾脏病(Chronic kidney disease,CKD)的共有组织病理改变,是肾脏受到持续不断有害刺激过度修复的结果,以肾实质细胞向肌成纤维母细胞转分化(Myofibroblast trans-differentiation,MTD)为特征。肾细胞包括肾小管上皮细胞、血管内皮细胞、成纤维细胞和单核吞噬细胞受损后失去其自身表型并转分化为肌成纤维母细胞,产生
桥梁、道路等许多建筑的振动方程都是偏微分方程。通过有限元方法将这些方程离散为二阶微分方程,再分离变量,就可以得到二次特征值问题(QEP)。本文主要研究的是二次特征值问题中,单特征值以及半单重特征值的一阶导数的误差分析以及高阶导数的数值计算。特征值导数的计算一般来说比较简单,公式是确定的。但是由于特征向量的不唯一性,计算特征向量的导数相对比较复杂。单模态法是计算单特征值所对应的特征向量导数的一种比较