论文部分内容阅读
定量构效关系(quantitative structure-activity relationship QSAR)作为药物设计研究中的一个重要计算方法和常用手段,在新药的开发和研制过程中占据了重要位置。近半个世纪以来,QSAR研究对有机合成化学、药物化学及药物设计的发展起了巨大的推动作用,已经成为研究物质理化性质与生物活性以寻求分子解释的一个强有力工具。以QSAR的技术来研究分析仪器所得到的谱学数据,并通过理论模拟波谱特征的工作通常被称为定量构谱关系(quantitative structure-spectrum relationship, QSSR)。由于谱学数据本身的复杂性和多样性,在很多情况下并不是仅仅简单地与结构之间呈现出线性关系,因此对其正确模拟和预测还存在一定困难。本文尝试在该领域进行了有益的的探讨,通过对新型分子结构表征技术的研究深入分析了有机化合物和生物分子的几类谱学行为,取得了较为满意的结果。具体工作包括:①从分子二维拓扑结构出发,根据原子之间相互作用方式和自身所处状态得到了用于描述原子所处分子微观化学环境和杂化状态的原子电性作用矢量(atomic electronegativity interaction vector, AEIV)和原子杂化状态指数(atomic hybridation state index, AHSI)。采用该法分别对48种吡喃单糖和25种呋喃单糖中大量等价共振碳原进行了表征,并以此建立起用于模拟单糖分子13C NMR化学位移的多元线性回归方程,所得模型的复相关系数r及交叉检验q皆在0.9以上。通过严格的统计诊断和模型检验表明所得模型具有较好的稳定性和预测能力。②通过定义有机化合物的36种原子碎片类型,并按分子中不同键距原子碎片成对出现次数构造多阶原子对频数矩阵,在此基础上构造了一种新的分子编码技术:原子对全息码(APH)。该法在一定程度上兼顾了通常2D分子拓扑描述子计算简便、易于操作以及3D分子结构表征方法理化意义明确、能够提取分子复杂结构信息等多方面优点,适合于药物及生物分子的定量结构色谱保留关系(QSRR)研究。文中尝试将APH方法应用于33个嘌呤衍生物和24个甾体化合物反相液相色谱(RPLC)保留数据的定量预测当中,所得偏最小二乘回归(PLS)模型的拟合复相关系数r2、留一罚交叉检验复相关系数q2及对测试集样本预测能力qpred2分别为0.990, 0.893和0.977, 0.897, 0.941。③从文献报道收集组建了一个包含819个样本的大尺度肽离子迁移谱碰撞截面数据库,以此为基础采用APH成功实现了该组数据的QSSR建模研究,通过内部及外部双重验证的办法对所得模型稳定性能及泛化能力进行了深入分析和检验,其结果表明APH码与肽离子碰撞截面呈显著线性相关,而对少数多肽则包含一定非线性因素。本文模型有助于实现计算机辅助肽离子碰撞截面定量预测自动化平台的构建。④基于分子拓扑图形特征和顶点连接方式,通过定义广义相关函数、性质相关参数以及距离关系函数等概念,将“面向用户”实际应用的观点及对目标问题“自适应性”的思想引入到分子结构表征当中,从而得到一种新型分子拓扑性质表征方法:广义相关指数(generalized correlative index, GCI)。使用该指数对41个多氯代二苯并-p-二噁英(PCDD)、115个多氯代二苯并呋喃(PCDF)、210个多氯联苯(PCB)和62个多氯代萘(PCN)在DB-5气相色谱柱上的保留行为进行了QSRR研究,所得模型复相关系数r以及交叉检验复相关系数q均在0.98以上。结果表明GCI指数具有较强分子结构表达能力及对化合物各类性质的优良适应性。⑤基于分子二维图形特征提出了一种新型结构参数化方法:分子电性作用矢量(molecular electronegativity interaction vector, MEIV)。采用该矢量对420个单质子化肽段结构进行表征并与其离子迁移谱碰撞截面Ω建立了3个优良的QSPR模型,采用内部及外部双重验证的办法对所得模型稳定性能及泛化能力进行了深入分析和检验。其结果表明MEIV与肽离子碰撞截面呈显著线性相关,同时包含一定非线性因素。⑥通过径向分布函数(RDF)按一定的采样间隔将原子之间的内在相关性映射到适当的坐标区间,从而形成了能够表达分子结构性质的特征图谱曲线,称为分子图形指纹(molecular graphic fingerprint, MoGF)。该法具有计算简便、无须实验参数、信息含量巨大、结构意义明确和表现形式直观等多方面优点。尝试使用MoGF对579个单质子化肽离子碰撞截面进行了系统的QSPR研究,通过严格统计检验证实了所建偏最小二乘(PLS)回归模型具有良好的稳定性和泛化能力,该模型对内部训练集和外部测试集样本计算结果的相关统计量r2, q2, RMSEE, RMSCV, qe 2xt, re 2xt, r0 2,ext, r0,ext’2, k, k′和RMSEP分别为0.991, 0.990, 5.526, 5.572, 0.990, 0.990, 0.990, 0.990, 1.003, 0.996和5.561。