论文部分内容阅读
随着基因组学、蛋白组学及生物信息学的出现,新的药物治疗靶点也不断涌现。同时,组合化学大大增加了新化学实体的数目,而活性高通量筛选技术的迅速发展也加快了候选化合物的筛选速度。但据报道其中40%的化合物会因药动学性质较差而被淘汰,不能进入临床试验以及最终上市。故尽早了解化合物的体内药动学行为,以确定其开发价值,即将化合物的药动学预测纳入到药物开发早期,是当前药物开发面临的严峻挑战之一。而采用基于结构的定量结构-性质关系(quantitative structure-property relationship,QSPR)方法,对化合物的关键药动学性质如吸收、消除及口服生物利用度进行预测,则有望为这一瓶颈的突破提供新的思路。基于此,本论文的研究目的为:探索采用QSPR方法,在药物的结构与其口服吸收分数、肝清除率、肝微粒体/肝细胞非特异性结合,以及口服生物利用度之间建立定量预测模型。在预测的同时,这些模型还可为设计具有较好药动学特征的新化合物提供一定的结构信息和理论依据。具体内容和结果如下:1、从影响药物口服吸收分数(Fa)的两个主要因素膜通透性和溶解性出发,采用Origin软件中的非线性拟合方法建立了药物口服吸收分数的QSPR模型。在103个药物的磷脂膜色谱保留因子logkIAM,pH=7.0、分子量、氢键供体和溶解性参数logSpH=7.0与Fa之间建立了QSPR关系,其中9个药物因存在主动转运及外排现象而溢出。结果训练集n=70,R2=0.85,Q2=0.80,测试集n=24,R2=0.93。94%的药物能被正确的分为低中高吸收程度(以30%和80%为界)。同时揭示了影响Fa的主要因素包括:代表药物膜通透性的logkIAM,pH=7.0、分子量和氢键供体数目,以及代表溶解性的logSpH=7.0。2、通过变量筛选,从50个药物的132个结构参数中找到13个变量,用多元线性回归方法与人体肝清除率(CLh)之间建立了QSPR模型,模型适用性及预测准确性均较好(训练集n=36,R2=0.85,Q2=0.65,RMSE=0.28;测试集(去除一个CLh实测值最小的溢出点)n=13,R2=0.73。50个药物中78%的药物折合误差<2,而折合误差>3的药物仅占10%,且平均折合误差为1.28)。同时揭示了影响CLh值的主要因素包括:最低空轨道能量(LUMO)、最高占据轨道能量(HOMO)、扭转能及氢键受体数目。采用类似方法建立了药物大鼠体内肝清除率预测模型。然后实验测定了10个醛糖还原酶抑制剂和4个α-糖苷酶抑制剂专利化合物大鼠体内的CLh值。最后将模型预测值与实测值相比,结果折合误差>3的化合物有4个(占33%)。此外部验证直接证明本文所建大鼠体内CLh模型具有较好的预测性能,进而间接说明OSPR方法用于预测CLh的可靠性。3、通过86个具有广泛性质的药物,逐步回归方法进行变量筛选后,多元线性回归方法建立基于结构的药物肝微粒体游离分数(fumic)QSPR预测模型。训练集n=64,R2=0.82,Q2=0.75;测试集n=22,R2=0.85。75%的药物折合误差<2,折合误差>3药物仅占2%,平均折合误差为1.33。上述结果表明模型适用性和预测准确性较佳。本文模型与文献两种模型的对比说明,中性和碱性药物具有较好的预测效果,特别是中性药物的预测有了明显改善,但酸性药物由于实测数据分布比较窄,适用性有待进一步提高。同时揭示了影响药物肝微粒体非特性结合的重要参数:logP、静电能、分子平均净电荷fi、荷正电基团数和负电基团数等。用类似方法对药物肝细胞游离分数(fuhep)QSPR预测模型进行了初步研究(n=37,R2=0.62,Q2=0.51,81%的药物的折合误差<2,折合误差>3的药物仅占8%,平均折合误差为1.41)。发现药物的logD7.0、原子总数、仲氨基数及荷负电基团数是影响药物肝细胞非特性结合的重要参数。最后探讨了fumic和fuhep之间的相关关系,结果二者存在较强的线性相关性(n=37,R2=0.83)。本文尤其揭示了代表静电作用的结构参数在药物肝微粒体和肝细胞非特异性结合中的重要性。4、由于吸收和肝清除是决定药物口服生物利用度(F)的两个主要参数。本文在建立了Fa和CLh预测模型的基础上,探索性的建立了111个药物的口服生物利用度QSPR预测模型。逐步回归变量筛选后,多元线性回归方法建模。模型评价结果表明模型的适用性虽然不理想(训练集n=82,R2=0.60,Q2=0.45,RMSE=21.06;测试集(2个药物由于系统前代谢和主动转运溢出)n=29,R2=0.55)。但是模型预测准确性较好:79%的药物的折合误差<2,折合误差>3的药物占13%,折合误差>5的药物占7%,折合误差>10的药物占3%,平均折合误差为1.64,70%左右的中高生物利用度药物能被正确分类。假阳性预测占17%,假阴性预测占3%。对F、Fa及CLh模型中共同参数的分析结果表明,亲脂性、极性及分子反应性参数对Fa/CLh及F值均有较大影响,但方向不同,这进一步阐明了建立成功的F预测模型的复杂性,为今后口服生物利用度预测模型的建立提供了新的思路。