论文部分内容阅读
hERG(humanether-a-go-gorelatedgene)钾离子通道被阻滞会导致心脏中毒和心室复极延长(长QT综合症),严重时可能会导致晕厥或猝死。常用的hERG钾离子通道毒性分析方法有:膜片钳技术、放射配体结合检测法、荧光分析法以及铷离子迁移法。对于药物早期研发来说,上述方法效率低而且昂贵。因此,在药物研发的初期,利用计算机模型对化合物是否具有hERG钾离子通道抑制作用进行计算预测研究是必要的,并且可以提高药物开发的效率。本论文第一部分对hERG钾离子通道抑制作用进行了研究。
化合物是否具有基因毒性,也是药物研发中需要考虑的重要因素。虽然目前已经有多种体内体外方法可以测试化合物的基因毒性,但是,在药物研发的早期,人们更希望有计算化学的模型可以用于对大量化合物进行筛选,以节省人力和物力。本论文第二部分运用计算化学的方法,建立了一系列化合物基因毒性的预测模型。
本论文主要包含以下研究内容:
第一部分基于含有1969个化合物的hERG钾离子通道阻滞剂与非阻滞剂数据集。使用支持向量机的方法,建立了两组模型来区分一个化合物是否具有hERG毒性。第一组模型选取了MACCSfingerprints作为描述符,而第二组模型是基于MOE描述符。以MACCSfingerprints所建立的前100个模型对测试集预测的平均正确率和平均马修斯相关系数分别为90%和0.77。以MOE描述符所建立的后100个模型对测试集预测的平均正确率和平均马修斯相关系数分别为89%和0.74。通过对描述符进行分析发现,分子疏水性和亲油性是决定一个化合物分子具有hERG钾离子通道阻滞作用的重要因素。其他一些分子性质如分子静电性质、基于范德华表面积的性质、刚性键的数量和分子表面皱纹也会对化合物是否具有hERG钾离子通道阻滞作用有重要影响。
此外,本章还使用了Y-扰乱的方法检验模型的稳定性,对得到的最优模型做Y-扰乱,证明所建立的模型是有效的。
第二部分基于从美国环境保护署(EPA)所公布的基因毒性数据中收集整理得到的包含90个化合物的中国仓鼠肺细胞的基因毒性数据库,以随机划分的59个化合物作为训练集,其余的31个化合物作为测试集,分别以MOE描述符和ADRINA.Code描述符为输入,利用支持向量机算法,建立了一系列基因毒性与非基因毒性的分类模型。最好的几个模型的预测准确率都在70%左右。可以看到这些模型的预测效果较好,为后续试验提供了指导。