基于深度学习的潜在抗HIV活性分子生成新方法研究

来源 :兰州大学 | 被引量 : 1次 | 上传用户:cgrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
艾滋病是对人类危害最大的疾病之一,由感染HIV引起。现阶段在全球范围内仍然缺乏有效治愈艾滋病的方法,抗HIV药物是防治艾滋病最有效的手段之一。HIV具有耐药性,因此需要不断发现新的抗HIV活性分子,以研制更多的抗HIV药物。本文对现有的新型药物设计方法进行改进,并采用两种不同的方法生成潜在抗HIV活性分子,以扩增潜在抗HIV活性分子库。本文为发现新的抗HIV活性分子提供了新思路,主要创新及工作内容包含以下几个方面:(1)搭建深度分子生成模型DGMM,旨在生成结构有效、新颖且性质无偏的分子。DGMM基于MLSTM、SRU、QRNN三种循环单元进行构造,采用源自ChEMBL的大型分子数据集进行训练。经过训练,基于MLSTM搭建的DGMM取得最优效果,其生成分子的平均有效性为98.31%,唯一性为99.93%,新颖性为89.33%,综合优于现有的化学语言模型。随后将最优DGMM生成的分子与训练集分子进行性质对比,实验结果表明DGMM生成的分子能够还原训练集分子的性质分布,验证了DGMM生成分子的性质无偏性。(2)搭建深度迁移分子生成模型T-DGMM,旨在生成潜在抗HIV活性分子,扩增潜在抗HIV活性分子库;搭建抗HIV活性预测模型AAPM,验证TDGMM生成分子的潜在抗HIV活性。为了验证迁移学习方法的有效性,T-DGMM基于两种不同规模的抗HIV活性数据集进行训练,最终在基于极小规模数据集训练的T-DGMM生成的分子中检验到已知抗HIV活性的分子。AAPM采用不同深度学习架构进行搭建,训练集规模为正负样本各一万,最终基于DNN的AAPM外部验证集准确率达88.90%。最后基于AAPM预测T-DGMM生成分子的抗HIV活性,其中最高68.29%被判别为抗HIV活性,验证了T-DGMM的有效性。(3)搭建深度强化分子生成模型R-DGMM,分别进行两个不同的任务。任务一是生成利匹韦林的相似物,最终R-DGMM生成了包含达匹韦林在内的9种抗HIV活性分子。任务二设计了组合评分函数,旨在生成同时具有潜在抗HIV活性、期望合成可及性及类药性的分子,最终R-DGMM生成了2种已知抗HIV活性的分子。两个任务均表明R-DGMM适用于生成潜在抗HIV活性分子。
其他文献
LPG汽车供燃系统产品的特点中外合资深圳中原液化天然气有限公司周恺承南海澳华液化石油气设备有限公司由南海投资发展公司和澳大利亚SMARTGAS公司合资经营,是国内最早成立的生产LPG(液化石油
结合“十二五”国家及造纸工业关于发展低碳绿色纸业规划要求,分析了制浆造纸过程能源消耗状况,重点讨论了当今国际上造纸业提倡推广的先进、成熟、适用的节能技术与装备,为我国
有人说,果酱是一个水果生命的延续。当季水果的保鲜期往往只有短短的几天,想让它的美味延续,那就做成果酱吧!把它的酸、甜、香、软交给一个个小瓶去保存。
霍尔推进器具有体积小、比冲高和可实现推力灵活调节的优点,搭载中小功率霍尔推进器的小卫星可执行轨道维持和精准姿态调节等任务,可实现无拖曳控制。然而,现有的霍尔推进器
为提高奥氏体不锈钢抗高温氧化及化学侵蚀能力,确立了以SiO2-BaO-Al2O3-Cr2O3为主要化学组成的氧化物陶瓷涂层体系,并对涂层的制备工艺进行了探讨。涂层制备工艺:研磨后的涂层粉
单核细胞增生李斯特氏菌(以下简称L.m)是一种严重的人畜普遍易感染的致病菌,可导致人和动物患脑膜炎、败血症、流产等,病死率高达30%~70%.该菌在自然界中广泛存在,土壤是主要
在气田开发中,气井的产能具有举足轻重的地位和作用,它是气田开发方案设计,气井合理配产的依据之一。目前,确定气井产能的方法有常规回压试件,等时试井,修正等试井和一点法测试,对于
为深入开展心脑血管病防治工作,我们于1997年开始在开封市三胜居民小区进行了以健康教育为手段的干预研究.并于1999年8月进行了中期效果评估,即对心脑血管病涉及的相关知识、
随着一声声汽笛的鸣响,总长度815米的5个码头泊位上,一艘艘满载成品纸的集装箱货轮缓缓驶离,在浩渺的江面上增添了几许雄壮。不时从工厂、码头穿梭来往的装卸车队,让现场呈现
糖尿病是一种以慢性血糖水平增高为特征的代谢性疾病,其中肥胖是发生2型糖尿病的一个重要危险因素。糖尿病的发生与肥胖的持续时间和最高肥胖程度密切相关,在肥胖人群体内脂