论文部分内容阅读
自20世纪90年代以来,密度泛函理论在物理、化学、生命科学和材料科学等自然科学和工程领域的方方面面取得了难以计数的成绩,因而成为了研究分子体系、凝聚态体系等多体系统中电子结构和化学反应的标准工具。密度泛函理论的广泛成功得益于以Hohenberg-Kohn定理和Kohn-Sham范式为基础的现代密度泛函理论的成熟框架,Hohenberg-Kohn定理保证了从基态电子密度到外势的单射关系,而Kohn-Sham范式提供了一种从给定的交换-关联泛函近似形式出发求解基态电子能量和电子密度的有效方法。现代密度泛函理论的核心问题是精确形式未知的交换-关联泛函,因此许多研究在探索精确交换-关联泛函的过程中提出了各种密度泛函近似。然而由于已有的Kohn-Sham映射还不够完备,交换-关联泛函近似的数学形式还不够精密等原因,在应用各种密度泛函近似进行的理论计算中仍未能全面而广泛地达到化学精度。为了提升密度泛函近似的预测精度和扩大其适用范围,传统的密度泛函研究需要使用更复杂的电子密度描述符,然而这也使得计算量随体系体积增长显著增加。本论文的中心内容是使用机器学习(machine learning,ML)对已有的交换-关联泛函近似进行系统的局域校正,以便得到精度更高、效果更好的密度泛函近似。与传统密度泛函近似的开发不同,作者尝试通过引入机器学习算法来修正现有的密度泛函近似,并完善其交换-关联泛函的形式,在尽可能使用简单的电子密度和密度梯度描述符的情况下,构建更加完备的Kohn-Sham映射,以期得到效果更佳的密度泛函近似。本论文中,作者通过机器学习,拟合了从电子密度和约化密度梯度到对Perdew-Burke-Ernzerhof(PBE)泛函交换-关联能量密度修正的半局域Kohn-Sham映射,建立起一套使用机器学习对PBE泛函做后自洽场修正的方案。该方案使用XGBoost这一梯度提升决策树方法构建对PBE交换-关联泛函的半局域修正,以G2/97标准数据集中的生成热数据为训练样本对修正模型进行训练,并对包括生成热、电子电离势、电子亲合能、反应能垒和键解离能在内的热化学和反应动力学性质的测试集做出了预测。测试结果表明,相比原始的PBE泛函,通过该修正方案得到的广义梯度近似(generalized gradient approximation,GGA)泛函——ML-PBE在分子生成热的预测精度上有了实质性的改进,并且对分子热化学和反应动力学的平均预测精度达到了广泛使用的SCAN meta-GGA的水平。在此基础上,作者继续深入探究并设计了一种使用机器学习模型对现有密度泛函近似进行半局域自洽场误差修正的通用方案。该方案使用人工神经网络模型,建立起一个从电子密度和密度梯度等GGA水平的描述符到给定密度泛函近似的交换-关联能量密度修正量的半局域Kohn-Sham映射。作者使用多层神经网络拟合了对 PBE、Becke three-parameter Lee-Yang-Parr(B3LYP)等泛函的交换-关联能量密度校正。在由几个分子的原子化能和总能量的精确参考值组成的数据集上,使用粒子群算法这一非梯度类全局优化方法,以Kohn-Sham自洽场的方式对神经网络校正模型进行训练,并对包括原子化能、生成热、电子电离势、电子亲合能、反应能垒和键解离能在内的热化学和反应动力学性质的测试集做出了预测。训练得到的机器学习校正密度泛函近似在各种化学性质的预测上表现均衡,对总能量和生成热等性质的预测精度相对原泛函有明显提升。使用该方案校正B3LYP泛函得到的ML-B3LYP增强泛函,在生成热等热化学性质的预测精度上均超过现有B3LYP泛函。经该方案训练获得的机器学习校正密度泛函近似可直接用于电子结构的相关计算,在不明显增加计算量的情况下,可得到相比原泛函精度更高的能量预测结果以及自洽的电子密度等泛函相关物理量。本论文的研究表明,将传统交换-关联泛函依据物理条件的推导与数据驱动的机器学习结合,有望得到在各种化学性质的预测上精度均衡的密度泛函计算方法。论文的第一章简要回顾了量子化学方法的发展历史与基本概念,介绍了密度泛函理论和交换-关联泛函的基本框架和概念,并总结了密度泛函方法发展的历程和面临的挑战。论文的第二章介绍了机器学习的基本概念和本文工作中使用的各种算法,并简要介绍了应用机器学习辅助研究密度泛函方法、设计新的泛函近似的主要研究方向和发展现状。论文的第三章介绍了本文的第一项工作,通过机器学习算法构建了从电子密度和约化密度梯度到交换-关联能量密度修正值的半局域映射,对广泛使用的PBE泛函进行了后自洽场修正,并评估了该修正泛函对各种化学性质的预测精度,相对原泛函取得了全面的提升。论文的第四章介绍了本文的第二项工作,使用神经网络模型构建了一种从GGA等级的密度描述符到给定密度泛函近似的交换-关联能量密度修正值的半局域映射,以自洽场的方式训练模型得到的修正泛函,可按照一般的密度泛函近似使用方式开展计算,但计算精度超越了原有泛函。论文的最后一章总结了本文的主要研究成果以及后续工作中主要的改进方向。