论文部分内容阅读
定量结构-活性关系(Quantitative Structure-Activity Relationships, QSAR)在药物设计中起着重要作用,在受体三维结构信息未知的情况下,尤为如此。早期提出的QSAR模型中的参数需要实验测定,而组合化学和高通量筛选的出现使得在较短时间内得到大量化合物成为可能。用实验方法测定大量化合物费时费力,因此对QSAR研究中的参数进行理论预测具有很强的现实意义。定量结构-性质关系(Quantitative Structure-Property Relationships, QSPR)则是应用QSAR原理研究分子结构与其理化性质之间的关系,在药学、材料科学、环境科学等诸多领域有广泛应用。第一章首先对QSAR/QSPR的概况进行介绍,包括发展历史、工作流程、建模方法、结构参数等。其后对本论文使用到的表面静电势描述符及其应用进行了介绍并提出了本论文的研究思路。第二章是尝试在氢键碱度参数pKBHX与氢键受体静电势描述符之间建立QSPR模型。首先,应用多元线性回归(multiple linear regression, MLR)方法建立pKBHX与静电势参数之间的QSPR模型。分组建模的结果表明,对碳原子中心组、氧原子中心组、硫原子中心组和卤素原子中心组,pKBHX与静电势描述符Vmin(Vmin的定义为空间最负的静电势)具有良好的相关性,而对于氮原子中心组,在进行了一定的删除相关性不高的氢键受体类别后的分组与Vmin也表现了良好的相关性。之后对本章研究的所有氢键受体建立了通用QSPR模型。模型的稳定性和预测能力经蒙特卡洛交叉验证得到了确认。第三章采用分子表面静电势描述符对取代基/片段疏水性参数进行了研究,在国际上首次从分子局部结构角度来阐释化合物疏水性与其结构的关系。首先,在疏水性取代基常数πX与取代基原子提取的静电势参数之间建立了QSPR模型。模型中的静电势描述符Vmin,Vs,max,ΣVMnd,+,Nindtot,Πind和σind2,-都具有明确的物理意义,而且还与线性溶剂化能关系(linear solvation energy relationship, LSER)中的氢键碱度、氢键酸度、空穴项、偶极/极化项具有良好的相关性,这使得模型具有良好的解释性。经过严格的蒙特卡洛交叉验证,模型的稳定性和预测能力得到了确认。之后对八组间位或对位的二取代苯及一组3-取代和4-取代吡啶进行了研究,使用上述六个描述符建立了各组的QSPR模型,得到模型总体上不如之前建立的单取代苯的模型。最后,对于Rekker片段参数和静电势描述符建立了两个QSPR模型。结果表明,片段提取的静电势参数可以很好的定量表达片段结构和疏水性质,而母体结构和连接母体和片段的键的状态对此没有什么影响。在第四章尝试建立线性溶剂化能关系参数S(偶极/可极化项)、A(氢键酸度)、B(氢键酸度)和E(过量摩尔反射率)与静电势参数描述符之间的QSPR模型。经检’验,S和A的MLR模型具有优秀的稳定性和预测能力,而B和E的MLR模型表现出了良好的稳定性和预测能力。四个参数的MLR模型与相应的高斯模型(gaussian process, GP)和最小二乘支持向量机(least square support vector machine, LSSVM)模型进行对比,结果表明,对于参数S和A,MLR模型在三者中最优,表现出良好的稳定性和预测能力,而对于参数B和E来说,GP模型是表现最优的模型,而且均明显优于MLR模型。第五章主要采用基于分子片段静电势参数的方法来建立5-羟色胺(5-hydrotryptamine,5-HT),多巴胺(dopamine, DA)和去甲肾上腺素(noradrenergic,NE)这三类神经递质转运体抑制剂的QSAR模型。通过对建立的MLR、GP和SVM模型的检验及对比可以发现,5-HT抑制剂活性与静电势描述符可以建立预测能力和稳定性良好的QSAR模型,包括MLR模型和GP模型,相对而言,GP模型在稳定性和预测能力方面要强于MLR模型。而对于DA和NE抑制剂活性和静电势参数之间建立的线性模型和非线性模型的预测能力一般,其模型质量都比5-羟色胺转运体抑制剂GP模型和MLR模型要差一点。