论文部分内容阅读
自由能是药物设计、材料设计以及生物化学过程等多个领域的研究中最核心的物理量之一。精准的自由能计算依赖于准确的哈密顿描述。量子力学可以准确的描述体系的势能面。但是在量子力学势能面下进行动力学采样十分得昂贵,目前的计算水平很难实现。而采用参考势能面的方法(reference-potential),可以避免在昂贵的目标势能面下采样,只需在始末态进行参考势能面到目标势能面的自由能差计算,就可以得到目标哈密顿下的自由能。这一方法可以很大程度的降低量子力学哈密顿下自由能计算的成本。而参考势能方法中,两个势能面间自由能差计算的收敛性是目前研究亟待解决的问题。本论文中,我将主要探讨在参考势能面方法框架下如何通过设计不同的路径改善自由能差的计算,并进一步探讨表征计算可靠性的若干指标,从而实现准确可靠的自由能预测。本论文中主要采用参考势能面方法实现从分子力学(molecular mechanics,MM)势能面到基于密度泛函理论(density functional theory,DFT)的量子力学(quantum mechanics,QM)势能面的计算。为了解决参考势能面方法中参考势能面(MM)和目标势能面(QM)之间自由能差计算的收敛问题,我们提出了三种不同的计算策略:直接一步热力学微扰计算(QM/MMD),中间插入一个半经验(semi-empirical SQM)哈密顿间接计算(QM/MM-B)以及采用非平衡功计算(QM/MM-NE)。此外还定义了一个物理量reweighting entropy S用来判断计算结果的可靠性。第二章中,我将以氨基酸侧链分子类似物(SCA)在水溶液中溶剂化自由能的计算为例,比较这三种策略的优缺点。结果表明,当S低于特定值时,直接用一步热力学微扰(TP)计算所得到的MM到QM的自由能差并不收敛。这是因为MM和QM势能面间的相空间重叠不足,TP计算的结果并未收敛。在MM和QM之间插入一个合适的半经验哈密顿,可以在一定程度上解决这一问题。此外,采用非平衡(NE)模拟完成MM到QM哈密顿的转变,也可以提高参考势能面法计算结果的可靠性。考虑到不同溶剂极化强度的差异,针对SCA分子在氯仿溶液中溶剂化自由能的计算,采用原子极化率对描述溶质分子的GAFF力场进行了优化。其结果表明采用原子极化率优化力场参数,可以反映出溶质分子对不同溶剂的极化响应。蛋白质和药物小分子的结合常数对结合自由能的变化十分敏感,结合自由能变化6kJ/mol,结合常数就会有一个数量级的改变。所以结合自由能的理论预测对准确度有着非常严格的要求。本论文中研究了参考势能面法预测蛋白配体结合自由能的有效计算策略,能够更加快速精准地进行理论预测。在第三章中,采用了参考势能面法计算了host-guest体系在SQM水平的相对结合自由能。由于MM和SQM势能面差异较大,为保证相空间有足够的重叠,已有方法采用多个窗口逐步完成MM到SQM哈密顿的转变(RPQS)。但计算量也会随之显著增加。为加快SQM水平结合自由能计算的收敛速度,本论文第三章讨论了QM/MM-NE策略预测的相对结合自由能的收敛性。其结果表明,QM/MM-NE方法只需1/2的模拟时长,就可以给出与RPQS方法相同的准确度和精度,很大程度地提高了计算效率。采用非平衡模拟,host-guest体系的相对结合自能在SQM水平已经达到收敛,但其理论计算结果与实验值之间的偏差较大,为进一步提高计算结果的准确度,第四章中,采用更准确的量子力学哈密顿,在DFT水平计算了host-guest体系的相对结合自由能。方法仍采用参考势能面法,其中目标势能面为BLYP/6-31G*。但由于在DFT哈密顿下采样过于昂贵,为了完全避免在DFT势能面下的动力学采样,本章中采用TP方法来计算参考势能面与目标势能面间的自由能差。为加快收敛,也采用了积分展开并在第二项截断的方法(CA)。研究结果表明,CA方法比TP方法收敛更快。对比QM/MM-D策略的计算结果,在MM和DFT之间插入一个合适的SQM哈密顿可以在一定程度上解决MM和QM相空间重合不足的问题。在DFT水平计算的相对结合自由能比SQM水平有了明显的提高。针对自由能计算结果的可靠性,本论文中研究了?U分布的均方差(σ),reweighting entropy(S),effective sampling size(Q)和bias metric(Π)这四个物理量,并给出了它们判断收敛性的参考数值。其中针对σ和Π,论文中通过数值模拟,深入分析了两者之间的关系,并推荐σ结合高斯分布的数值模拟方法(CGS)以及Π>0.5作为计算结果可靠性的判断标准,但是更精准的判断标准有待进一步的研究。虽然本文中提出的三种策略可以改善参考势能面法在QM水平的计算结果,但对于高水平的目标哈密顿如DFT,参考势能面和目标势能面之间存在较大差异,即便使用非平衡模拟,也很难得到收敛的计算结果。也有其他方法可以实现在QM水平的自由能计算,如Force matching,机器学习(machine Learning ML)等,其中ML方法自主学习的特性,可以很大程度地降低计算量,虽然仍存在一定的局限性,但也在快速地发展和完善。