论文部分内容阅读
蛋白质作为生物功能的主要承担者,吸引着物理、生物和化学等各领域的广泛关注。而分子动力学模拟因其能同时提供精确的结构和即时的动力学信息,成为了一种极为重要的蛋白质研究方法。然而在现有的计算能力条件下,相对准确的全原子分子动力学模拟很难达到典型蛋白质功能动力学所涉及的时间尺度,这一定程度上限制了它的应用。为了克服这种困难,人们发展出了多种高效采样策略来提高分子动力学模拟的效率,其中包括:1)通过对蛋白质分子做粗粒化近似来提高分子模拟的采样效率;2)基于统计物理学原理,发展分子模拟的加速采样方法。本论文对以上两种思路都进行了实践。一方面,我们在动态能量面理论的框架下构建了一套描述力学、化学等外部因素调控下的蛋白质别构和功能动力学的粗粒化模型,并用于研究典型信号蛋白钙调蛋白在疏水碳纳米管作用下的生物毒性机制和大肠杆菌粘附素的catch-bond效应的分子机制。该模型可用于研究分子马达、分子伴侣等各类蛋白体系的动力学过程。另一方面,我们也发展出了一套基于构象空间粗粒化来加速采样的算法。该方法可以让我们在不改变分子力场、不使用高温或偏置势的前提下加速构象采样,并有着良好的可移植性。另外,为了解决粗粒化模型精度较低的问题,我们还发展出了一套利用蛋白质氢交换实验数据来优化粗粒化模型的整合分子模拟方案。具体来说,我们的工作主要由以下四个部分组成:(一)疏水纳米粒子对钙调蛋白功能动力学影响的粗粒化分子模拟纳米物质在工业和日常生活中的广泛应用已经引起了人们对于其可能造成的生物毒性的担忧。越来越多的证据将纳米粒子的毒性和细胞信号通路的阻断联系在一起。在本工作中,我们通过研究疏水碳纳米管(CNT)对钙调蛋白(calmodulin/Ca M)的功能运动的直接影响来给出CNT生物毒性机制的一种解释。Ca M是细胞中最重要的信号蛋白之一,而它的信号功能依赖于钙离子调控的构象变化。通过粗粒化模拟我们发现,CNT改变了Ca M的构象平衡,使其从closed态转变到open态并失去感应Ca2+的能力。此外,CNT提高了Ca M的Ca2+亲和性,从而可能破坏细胞内的钙平衡。这些结果表明疏水碳纳米管不仅抑制了Ca M作为Ca2+感应器的信号传递功能,还将Ca M变为一种能与其他正常的Ca2+结合蛋白竞争Ca2+的有毒物质,揭示了纳米粒子生物毒性的一种新的物理机制。(二)大肠杆菌粘附素Fim H的catch-bond效应分子机制的粗粒化模拟一些研究表明,机械力可以作为一种重要的生物信号来调控各种分子和细胞行为。例如,大肠杆菌粘附素Fim H与其配体的结合强度会由于外力的作用而得到反直觉的增强,即所谓的catch-bond效应。这种效应对于细菌粘附以及大肠杆菌感染有着极为重要的作用。为了深入研究它的分子机制,我们在动态能量面理论的框架下构建了一套能够描述Fim H的catch-bond效应的粗粒化模型。相应的模拟结果很好地再现了catch-bond效应的主要实验现象,并提供了一个外力调控细菌粘附过程的完整图像。模拟结果还揭示了别构过程的双向耦合机制,即外力导致的配体结合强度的增加和配体结合导致的catch-bond效应的机械力阈值的降低。另外,我们还研究了结构域分离、构象变化和配体结合的路径,展示了多路径动力学对catch-bond效应的贡献。这些结果提供了机械力调控蛋白粘附过程的详细分子机制,加深了人们对于机械力作为信号调控生物过程的认识。(三)一种基于构象空间粗粒化的加速采样算法对于有着复杂能量面的系统,用分子模拟进行构象采样是一项比较困难的工作。这里我们基于构象空间的粗粒化,提出了一种新的加速采样方法。在该方法中,局部平衡区域将被粗粒化,即用轨迹在该区域的平均驻留时间和访问次数来表征该区域的采样数,并且该区域内将不再进行任何直接的动力学模拟。而通过更新访问数以及从该区域生成向外轨迹的操作,细致平衡条件可以得到满足。这种粗粒化操作还可以通过合并周围的收敛区域来进一步实现。当构象空间里所有物理区域都被局部平衡区域所覆盖时,全局平衡就达到了。为了测试该方法,我们将其应用于包含多个势阱的两个二维模型势和一个蛋白体系。相比传统的动力学模拟,我们的方法至少能提供3个数量级的效率提升,而和其他一些广泛应用的加速采样算法相比也有着相近的效率。另外,我们的方法还能捕捉到一些动力学信息。以上所有结果都表明,我们的方法能在不使用高温和偏置势的前提下,高效而准确地解决采样问题。(四)蛋白质氢交换的多尺度模拟方法在这个工作中,我们首先给出了一种基于粗粒化分子动力学模拟来得到氢交换数据的可行方法。通过将基于原子间相互作用的粗粒化模型和全原子结构重建算法相结合的方法,我们以一个合理的精度重现了蛋白质的氢交换实验数据。而在此基础之上,我们还发展出了一套基于氢交换实验数据的约束,通过迭代优化的策略来改进粗粒化力场的方法。以上结果表明,结合氢交换数据来优化蛋白质粗粒化分子力场是一种可行的整合分子模拟方案,并能帮助我们克服粗粒化模拟所面临的精度不足的瓶颈。