【摘 要】
:
有机化学是现代多个学科领域的基石,深刻改变着我们生活的方方面面,近代以来科研工作者一直致力于探索如何更高效的合成有机化合物,自上世纪60年代起,计算机技术初露锋芒时就有科研工作者将计算机技术用于合成规划,但是由于当时计算机算法和算力的制约,先驱者开发的计算机辅助合成规划算法并没有被学术界广泛关注。如今,随着计算机算力的大幅提高和人工智能机器学习算法的飞速进步,计算机辅助合成规划系统也因新的方法的融
论文部分内容阅读
有机化学是现代多个学科领域的基石,深刻改变着我们生活的方方面面,近代以来科研工作者一直致力于探索如何更高效的合成有机化合物,自上世纪60年代起,计算机技术初露锋芒时就有科研工作者将计算机技术用于合成规划,但是由于当时计算机算法和算力的制约,先驱者开发的计算机辅助合成规划算法并没有被学术界广泛关注。如今,随着计算机算力的大幅提高和人工智能机器学习算法的飞速进步,计算机辅助合成规划系统也因新的方法的融入而高速发展。逆合成预测算法是计算机辅助合成规划系统中极其重要的组成部分,一个高精度、可靠的逆合成预测算法可以大大节省科研工作者的工作时间和精力,并且可以降低合成探索中失败的概率从而节约研发成本,对药物发现领域极为重要。近些年来,人工智能-专家融合逆合成预测算法已经可以帮助科研工作者寻找复杂天然产物的合成路线,但是该种算法需要大型团队经过数十年的努力来手动编码化学反应规则和合成策略,未能做到完全的自动化。鉴于化学反应知识库更新速度极快,完全将化学反应手动编码是一项艰巨的任务,纯数据驱动的逆合成预测算法则有望从海量数据中自动学习化学反应规则,可以完全将人类从繁杂的手动编码任务中解放出来。本文致力于机器学习数据驱动的逆合成预测算法的研究,提出了一种全新的单步逆合成预测模型,并且详细评测了多步逆合成预测算法。具体的创新及工作内容包括以下两个方面:1.提出一种全新的数据驱动的单步逆合成预测模型Retro Prime,该模型基于神经翻译原理,整合化学家的逆合成分析思路:(1)识别反应位点并将目标分子转化为合成子;(2)补全离去基团得到目标分子对应的反应物。两个阶段我们都使用先进的自然语言处理模型Transformer来完成。在标准的USPTO-50K化学反应数据集中,分别在化学反应类型给定和未知的预测条件下达到了64.8%和51.4%的Top-1精度,并且在百万量级的化学反应数据集USPTO-full中与最先进的基于Transformer的逆合成模型精度接近。Retro Prime还包含了针对性的策略来应对基于神经翻译的逆合成预测模型存在的两个问题:多样性较差、化学不可信结果比例高。这些问题还鲜有研究者提出针对性的策略,Retro Prime被设计来应对这些挑战。2.详细评测了逆合成模型的搜索框架、反应过滤器以及单步逆合成模型数据集的可靠性对合成路径合理性的影响。并且以合析树抽象逆合成搜索树,大大改进了深度优先算法这一基准算法的预测性能,通过在两个测试集中测试多达10种多步逆合成模型配置归纳总结出三类数据驱动的多步逆合成模型存在的路径规划问题:(1)原始数据的错误导致的预测路径不合理;(2)多反应位点化合物合成路径中的位点竞争反应冲突;(3)规划的路径相应的反应条件与反应物不兼容。本工作详细研究了多步逆合成模型的部件对上述规划问题的效果,并讨论了解决这些问题的方法。
其他文献
植物内生真菌次级代谢产物是微生物次级代谢产物的重要组成部分,具有类型多样,生物活性丰富的特点。本论文从当归(Angelica sinensis)中得到的两株内生真菌拟康氏木霉菌(Trichoderma koningiopsis)和白耙齿菌(Irpex lacteus)进行了菌株鉴定,并系统地研究这两株真菌的次级代谢产物及其生物活性。本论文第一、二章主要对取材背景研究和目标菌株鉴定进行了系统阐述。第
人工智能技术的日益勃兴使媒体传播方式呈现多元立体化,电子媒介交流正以崭新的方式,视觉传播、口语传播得以改观,以AI主播为代表的人工智能技术不断被探索应用,为信息传播领域的重构和优化开辟了新路径,不仅给传播者与受众搭建了良好沟通互动的桥梁,还为双向互动式的口语传播提供了新的可能。当下AI主播的虚拟形象深入人心,利用集成语音合成、唇形合成、表情合成、动作合成的多模态合成等技术,逼真模拟真人的形象和声音
光电探测器是一种基于光的波粒二象性的器件,将光信号转变为电信号,在民用、工业、军事等领域中被广泛使用。依据原理主要分为两种,一种是依据光伏效应,这种光电探测器主要工作在零偏置或反向偏置,有着低的暗电流和良好的量子效率,被用于弱光探测以及单光子探测,代表性产品有碲镉汞光电探测器以及铟镓砷光电探测器。另一种采用的是光电导效应,这种光电探测器必须工作在偏置电压下,主要是利用光照产生的光生载流子,提高载流
《义务教育英语课程标准》明确提出,阅读对于中学生综合语言运用能力的培养起着重要作用,英语教学也应该关注学习者的个体差异,因材施教,尽可能的满足个体需求进而达到最优的整体教学效果。本研究以英语课程标准对学生的要求为背景,以最近发展区理论和教学过程最优化理论为指导,通过分层教学模式来提高学生阅读成绩的一项行动研究。研究中笔者使用了阅读测试、访谈及问卷调查等调查工具,试图解决以下两个研究问题:1.如何利
莽草酸途径来源的混源萜是一类广泛分布在植物、高等真菌和海洋无脊椎动物中的天然产物,其结构类型复杂多样且具有良好生物活性,是新药物开发的重要先导资源。但由于结构复杂且含量低,如何高效获得该类化合物一直是个挑战。从生物合成的角度来说,该类化合物首先是由莽草酸途径和萜类途径合成共同中间体异戊烯基对苯二酚,随后在各种不同的后修饰酶催化下产生结构多样的化合物,其结构的复杂性和多样性主要来源于不同的后修饰。在
传统的质量管理模式由于其存在信息化程度低、信息共享与协同困难、可视化程度低等缺陷,难以满足桥梁工程施工质量管理发展的需要,而BIM技术因其技术特点恰能较好弥补上述缺陷。但目前国内关于BIM技术在桥梁工程施工质量的管理实践尚处于初级探索阶段。乌东德河门口大桥是国内为数不多且较早开展BIM施工质量管理的项目,为此,剖析乌东德河门口大桥BIM施工质量管理案例,有助于完善我国桥梁工程BIM施工质量管理模式
【目的】分析设施栽培下2个软枣猕猴桃品种‘龙城2号’‘魁绿’的光合生理特性,为阿拉尔垦区设施软枣猕猴桃种植提供理论依据。【方法】以2年生‘龙城2号’和‘魁绿’嫁接苗为试材,使用Li-6400xt测定叶片净光合速率(Pn)、气孔导度(Gs)、蒸腾速率(Tr)、胞间二氧化碳浓度(Ci),采用乙醇浸提法测定叶绿素含量。【结果】1)‘龙城2号’软枣猕猴桃叶片叶绿素a、叶绿素b、类胡罗卜素含量高于‘魁绿’,
随着工业的高速发展和居民生活品质不断改善,进而导致了人们对能源需求的日益增加以及对环境保护意识的日渐提升。这些因素促使我们加快了开发清洁可再生能源的进程。许多无污染的能源被用在生产生活中,并且它们展现出了化石燃料不具备的优势。目前,运用光电技术来进行水的分解过程是捕获太阳能来制取氢气行之有效且前景广阔的一项技术,它是借助半导体光电极来实现产生氢气以及氧气的过程。其中,光阳极产氧过程是光电催化水分解