基于机器学习的药物稳态分布容积的预测

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:boshi9529
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稳态分布体积(volume of distribution at steady state,VDss)是药物的一个基本药代动力学参数,可以衡量药物在体内分布的有效性。它可以与清除率一起决定半衰期进而决定给药间隔。然而,稳态分布容积值的获取目前仍然高度依赖于劳动密集且成本高昂的体内和体外实验,这给制药行业带来了沉重负担。尽管出现许多相比于实验方法耗时更少、效率更高的计算研究,但稳态分布容积的预测模型在实践中并没有得到广泛应用,这是因为训练的数据集所涵盖的化学多样性信息有限而导致这些模型的泛化性较差。本文通过收集13篇文献以及Drug Bank数据库中的数据,然后进行数据清洗,最后得到目前最大的VDss数据集。该数据集涵盖更广泛的物理化学信息,化合物的理化性质与已公布的数据集一致,可以作为未来研究稳态分布计算预测的基准数据集。本研究分别用Mordred和Deep Chem计算分子描述符和分子指纹,并进行特征选择以构建预测模型。使用五种机器学习方法用于建立回归模型,网格搜索用于优化超参数,十倍交叉验证用于评估模型。通过模型构建以及优化发现,Mordred特征的模型结果要强于利用分子指纹建模结果。Mordred得到的最佳预测模型为Light GBM,其结果为Q~2=0.837,R~2tes t=0.814,具有较好的稳健性和泛化能力,可用于对VDss的预测。利用自动机器学习(automated machine learning,Auto ML)工具Auto Gluon构建回归模型,这是首次将Auto ML运用于稳态分布容积的预测。此外,分析了特征选择前后以及模型优化前后的准确性和稳定性。分析结果表明,Auto Gluon进行Auto ML建模优化后的模型对VDss有一定的预测作用。与传统的机器学习算法相比,Auto Gluon虽然没有达到目前最好的预测效果,但有效缩短了计算时间。其次,通过对优化前后的模型进行分析,发现大部分机器学习模型经过优化后,预测更加准确,预测能力更稳定。本研究首先整理了人类稳态分布容积目前最大的数据集,接着利用该数据集构建模型,首次将自动机器学习引入人类稳态分布容积预测中,为后续自动机器学习在稳态分布容积中的应用打下基础。最后利用传统机器学习建模,得到稳定性较好的Light GBM模型,为早期药物发现提供有价值的指导。更重要的是,报告的数据集可以作为基准用以促进未来的研究。
其他文献
三酰基甘油(Triacylglyceol,TAG)在植物体内的生物合成主要发生在内质网中,该过程涉及脂肪酸底物从叶绿体到内质网的转移过程。微藻叶绿体定位的脂肪酸转运蛋白(FAX1和FAX2)和一种内质网定位的ATP结合型转运蛋白(ABCA2)最近被报道参与脂肪酸转运对脂质合成起重要作用,但两种脂肪酸转运蛋白对TAG的合成是否具有协同作用及其调控机制至今还不清楚。本研究首先构建了FAX1/FAX2融
学位
基于各种有机、无机的纳米药物递送系统在癌症靶向治疗和其他方面研究中获得越来越多的关注并在实际中被广泛应用。在药物递送领域的研究中,与有机纳米材料相比,无机纳米材料具有更加易于控制、修饰和联合治疗等优势。更重要的是,无机纳米材料中的多组分“核-壳”结构可以通过修饰不同的基团实现多功能特性,因此“核-壳”结构纳米复合物在药物靶向递送、生物医学成像以及精确治疗等领域具有重要的应用价值。同时多组分“核-壳
学位
在自然环境中存在很多刺激因素,它们会引发生物机体、细胞产生应激反应,这些刺激因素被称为应激原。人体经常暴露在许多应激原中,这使得人类自身进化出许多防御和延缓机制。MAPK通路(丝裂原活化蛋白激酶通路)是真核生物中应用最广泛、最关键的应激反应信号通路。其中ASK1(凋亡信号调节激酶1),又称MAP3K5,是MAPK家族成员之一,其异常表达会导致多种应激性疾病,如非酒精性脂肪性肝炎和多发性硬化症。因此
学位
临床上梨状肌综合征的治疗方法较多,其中尤其以针灸推拿疗法效果明显,且副作用小,易于被患者所接受。本文主要通过针刺治疗、灸法治疗、推拿治疗、针灸推拿联合中药及联合康复治疗,对近年来针灸推拿治疗梨状肌综合征进行研究,认为临床上治疗本病所采用的方法呈现出几种疗法相互联合的趋势,通过各种疗法的优势互补,效果更加显著,需作进一步的探讨。
期刊
在许多肿瘤细胞,如结直肠癌细胞系、骨肉瘤细胞系中发现某些核心时钟基因表达下调,将其过表达后,有助于疾病的治疗与预后。但生物钟基因过表达后细胞节律及表型的变化尚不清楚,本文研究内容如下:(1)利用无缝克隆技术构建核心时钟基因bmal1、clock、cry1和cry2的质粒表达载体。(2)在骨肉瘤细胞U2OS中通过瞬时转染分别过表达bmal1和clock、cry1和cry2。在m RNA和蛋白水平验证
学位
随着水产养殖行业的快速发展,水产养殖饵料的需求逐年攀升。湛江等鞭金藻作为优质的育苗饵料,对于水产养殖行业非常重要。然而受限于湛江等鞭金藻循环培养、收获及低温保存技术的发展和成本,至今湛江等鞭金藻大规模集约化生产和供应尚存在很大挑战。因此本论文就湛江等鞭金藻循环培养技术、收获技术以及低温保存技术开展了探究。湛江等鞭金藻30005在仅补充了微量元素而未处理的循环培养基中无法实现正常的生长,表明可能受到
学位
在我国,乳腺癌作为一种最常见的女性癌症,一直威胁女性健康并呈逐年上升趋势。尽管最近在乳腺癌治疗方面取得了进展,包括化疗、内分泌治疗和HER2靶向治疗,但乳腺癌细胞的高增殖性、侵袭性、转移性潜力以及耐药性,一直是乳腺癌患者治疗失败和生存率低的主要原因。根据已有的研究表明,发现KLF家族成员参与乳腺癌发生发展并起到关键作用。KLF9(锌指转录因子)同多种类型癌症的发生和不良预后密切相关。有数据表明,K
学位
药物相互作用是药物不良反应的主要原因之一,每年因为发生严重的药物相互作用而导致大量患者的死亡。随着药物基因组学的进展,药物相互作用的定义在不断扩展,包括药物基因相互作用(DGI)和药物药物-基因相互作用(DDGI)。药物基因相互作用(DGI)已经纳入到一些治疗指南中,而关于药物药物-基因相互作用(DDGI)的研究却十分有限。细胞色素P450酶在药物相互作用中起着重要的作用,而关于细胞色素P450酶
学位
2,3-丁二醇(2,3-BD)及其前体乙偶姻(AC)是具有混酸代谢途径微生物的典型发酵产物,在调味剂、燃料添加剂、溶剂、聚酯、橡胶和燃料等领域具有广泛应用。本研究通过诱变筛选得到一株可产乙偶姻和2,3-丁二醇的枯草芽孢菌株,优化了发酵培养基,并研究了供氧对乙偶姻和2,3-丁二醇转化的调控。该菌株的产物分布具有鲁棒性,且产物得率高,具有工业化应用前景。首先,进行了产乙偶姻和2,3-丁二醇的芽孢杆菌的
学位
具有贯通大孔结构的生物相容性水凝胶材料在组织工程、细胞分离等领域具有广泛应用前景。现有材料体系往往难以兼具大孔结构(约100微米)、机械强度、生物相容性、活性调控等多方面的功能要求,尤其是贯通大孔结构与机械强度的平衡。针对上述问题,本研究基于组织工程领域常用的天然生物材料——丝素蛋白,发展了一种基于冷冻光交联的贯通孔结构构建方式。其创新之处在于相对常规水凝胶体系,在冷冻条件下对丝素蛋白进行光氧化交
学位