【摘 要】
:
药物研发是一个相当耗费时间以及成本高昂的过程,在新的药物研发的过程中,为了研发出安全有效的新药物,需要进行反复测试以及大量的临床实验的化合物就高达成千上万种。药物研发一般需要经过临床前研究,临床研究,FDA药品审查过程以及上市后的安全监控等漫长的步骤及监管,其研发的时间维度可见一斑。通常,药物平均研发周期在10到15年,约8亿美金研发成本,一般来说,90%的新型药物无法通过一期临床验证,研发过程中
论文部分内容阅读
药物研发是一个相当耗费时间以及成本高昂的过程,在新的药物研发的过程中,为了研发出安全有效的新药物,需要进行反复测试以及大量的临床实验的化合物就高达成千上万种。药物研发一般需要经过临床前研究,临床研究,FDA药品审查过程以及上市后的安全监控等漫长的步骤及监管,其研发的时间维度可见一斑。通常,药物平均研发周期在10到15年,约8亿美金研发成本,一般来说,90%的新型药物无法通过一期临床验证,研发过程中带来的高污染等问题也给新药研发带来了许多的挑战和坎坷。随着大数据技术的不断发展以及算力的增强,越来越多的研究聚焦于使用大数据来研究老药新用即药物重定位领域,其研发目的在于通过机器学习等算法来实现加速中间步骤(如药物发现以及临床前研究的阶段),降低成本,以及使得药物研发在早期阶段能够实现更好的筛选药物以及预测分子特性的目的,不仅可以节省大量的研发成本而且能够显著的降低后期实验的工作量。本文的主要研究内容是基于多源异构药物信息网络的药物重定位技术研究,具体研究内容包括:(1)提出了一种基于深度学习的药物-疾病预测模型Graph DDF。该模型首先通过随机游走算法对多源异构药物信息网络进行了数据预处理操作,并通过Graph CNN模型融合多源药物信息网络的节点嵌入表示,结合集体变分自编码器作为输入数据,通过重构药物节点的嵌入表示和已知的药物-疾病的关联关系完成训练。不仅可以免去传统特征提取造成的人为误差,同时结合随机游走算法生成的初始特征作为输入,免去了稀疏的初始向量带来的参数负担,同时结合Graph CNN模型能够更好地融合多源异构网络中节点的特征信息和复杂的非线性网络拓扑结构,通过最终训练得到的网络低维嵌入作为节点的有效表示,并结合集体变分自编码器做药物和疾病的最终预测。通过实验结果说明,在不同的正负样本场景下,Graph DDF模型相较于其他对比模型具备更高的预测性能,AUC达到93.48%,AUPR达到94.82%。同时,通过计算十次实验的平均值的方式,提供了前100的药物-疾病关联关系序列,结合Drug Bank和借鉴文献对前列较为有潜力的预测关系进行了说明,部分药物-疾病关系已经被收录在Drug Bank中。(2)提出了一种基于图神经网络的药物-靶标预测模型Graph DT。通过重启随机游走算法对药物信息网络中的节点做数据预处理,得到预处理后的节点的特征表示后,将数据中的同构网络和特征表示作为输入,运用多种图神经网络模型训练最小化损失的基础上选择最优的药物-靶标预测模型。评价指标上选用了AUC和AUPR,在十倍负采样和全负采样的数据下进行十折交叉验证的对比,经实验表明,Graph DT在不同场景下预测药物-靶标关联关系,AUC和AUPR评价指标均优于其他对比模型,其中Graph DT模型AUC值为91.97%,AUPR值为82.19%。另外,为了减小实验误差,通过十次实验计算药物-靶标关联关系预测分数的平均值的方式,选取了前列较为有潜力的部分药物-靶标关联关系进行了简要的讨论分析,并提供了前100的药物-靶标预测关联关系,这些药物-靶标关系具有更大的应用于药物重定位的可能性。
其他文献
常见的二维码图案仅由黑白方块组成,表现形式单一且仅能被具有解码功能的设备所识别,缺乏语义表达。二维码的美化即通过改变二维码的码块形状、颜色或嵌入图片等,使得原有二维码更具吸引力。随着二维码在日常生活中的普及,二维码的美化变得越来越重要,一方面,美化后的二维码(如嵌入logo等方式)能够带来更加直观的信息内容,有助于加深人们的印象并有利于推广。另一方面,二维码的美化能够满足人们对二维码个性化的需求,
新宁崀丰脐橙是中国四大脐橙之一,果实风味浓郁,甜酸适口。脐橙发酵酒的开发不仅可增加产品附加值,延伸产业链,还可带动当地农民增收,实现乡村振兴,具有广阔的开发前景。但脐橙酒加工面临“后苦味”较重和产品香气较寡淡等瓶颈问题,严重影响脐橙酒的品质,制约了产业的快速发展。本研究以崀丰脐橙为原料,采用不同活性干酵母发酵脐橙汁,综合评价果酒品质,选择最适宜的酵母;选用优良酵母在不同温度下发酵脐橙汁,考察脐橙酒
碘佛醇(Ioversol),是一种临床中广泛使用的第二代非离子型碘造影剂,具有毒性小、水溶性大、黏度小、渗透压低、不良反应发生率低和价格相对低廉等优点。碘佛醇的合成路线有十几条,但目前合成工艺中仍存在溶剂用量大、路线长、杂质含量高、收率低等问题,需要通过工艺改进来提高收率和纯度。本论文以5-氨基-N,N-双(2,3-二羟基丙基)-2,4,6-三碘间苯二甲酰胺(2)为原料,经酰化反应、酯水解反应、烷
随着汽车保有量的快速增长,产生了一系列的问题,例如交通事故数量的攀升和能源消耗的加剧。而自适应巡航系统作为汽车高级辅助驾驶系统的其中一种,不仅能够减轻驾驶员的行驶负担,在一定程度上也减少了交通事故的发生;此外,发展新能源汽车能够缓解能源消耗和环境污染问题。本文以纯电动汽车作为研究对象,结合V2X无线通讯技术可以获取周围车辆信息的优势,对协同式自适应巡航控制(Cooperative Adaptive
多相永磁同步电机(Multi-phase Permanent Magnet Synchronous Motor,MPMSM)具有振动噪声低、电能转换效率高、电机功率密度大等优点。模型预测控制(Model Predictive Control,MPC)具有建模方便、鲁棒性好、易于处理多输入多输出问题等优点。将模型预测控制与多相电机结合具备较好的科研价值。本文主要工作涉及十八相永磁同步电机本体结构改进
细胞死亡包括程序性细胞死亡和坏死,随着研究的不断深入,许多新型死亡方式的不断发现,更新着人们对细胞死亡概念的认识。而近几年所提出的传统化疗药物可以引起免疫原性细胞死亡也为肿瘤治疗提供了一种新的策略。黑色素瘤是皮肤中最具侵略性的肿瘤之一,过去几年中发病率不断升高,但传统治疗方法有限,而免疫疗法似乎是一种可行的治疗方法。为了减少传统给药方法引起的副作用并增强机体对肿瘤细胞的免疫杀伤作用,我们首次开发了
随着汽车安全技术的进步,成人乘员在汽车碰撞事故中得到了较好的保护,儿童乘员的安全防护问题却日益突出。为进行儿童损伤机理及其防护措施的研究,有必要开展幼龄骨骼生物力学试验。由于伦理等现实因素,儿童骨骼的力学性能研究受到了极大限制。动物骨骼作为人类骨骼的替代物在生物力学试验中发挥了重要作用。因此,借助动物试验获取大量幼龄骨骼材料参数,定量分析骨骼生长发育过程中力学特性变化,是开展儿童生物力学研究的重要
千金子[Leptochloa chinensis(L.)Nees]是一年生杂草,能够在淹水和旱地条件下生长,在直播稻田的危害最为严重。千金子种子量大且休眠期长,只要条件合适就可以萌发生长。目前对千金子种子萌发的研究甚少,为了了解千金子种子和幼苗在萌发生长过程发生的生理生化变化,以及有效防控千金子。本文对世界性农田恶性杂草千金子的萌发过程进行深入研究,主要研究了千金子种子的休眠及萌发特性、千金子幼苗
预测药物和靶标之间的相互作用对于开发新药物非常重要,它可以加速药物开发的过程并且降低所需的成本。然而传统的临床试验需要消耗大量的人力、物力,既昂贵又费时。传统的机器学习方法大多采用一维字符串或者描述符表示药物化合物和蛋白质靶标,这种基于手工特征的方法不能完整提取药物分子和蛋白质靶标的特征。深度神经网络在特征提取过程中没有考虑和充分利用药物内部的结构信息。因此急需研究新的方法来预测药物和靶标之间的相
化石能源的广泛应用造成的环境污染和能源危机已成为当今世界的两大问题。开发基于电化学能量存储的新能源器件,对于缓解环境污染、解决能源危机具有重要意义。其中,电极材料的本征特性在很大程度上决定了新能源器件的性能、成本和可靠性。通过调控电极材料的组分及其“电子/相/微观”结构,有助于优化电荷转移和离子扩散过程,为高性能电极材料的设计和制备提供了重要的理论和现实意义。与二次电池相比,双电层电容器具有更高的