基于异构极性网络的药物—药物副作用表示学习方法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:musicwen5918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
联合用药是疾病治疗中常规和普遍的治疗策略,通常能够达到比较好的治疗效果。因此,联合用药引发的药物-药物相互作用(Drug-Drug Interaction,DDI)一直是人们关注和研究的热点。事实上,DDI是一把双刃剑,既有正向的药效相互促进作用,又有负向的药物-药物副作用(Drug-Drug Adverse Reaction,DDADR)。相对于找到药物之间的正作用而言,发现药物之间的副作用更加困难。虽然在药物开发阶段会进行大量的体内和体外实验,筛选出可能产生副作用的药物组合,但是这个过程消耗巨大的成本,并且需要较长的实验周期。随着信息化技术的发展,大量的医药数据被汇总与挖掘。研究者开始借助机器学习方法对DDADR进行预测,提出了一些有效的预测方法,但是仍然面临很多挑战,主要包括:(1)现有的大多数DDADR预测方法只简单地利用药物相关的信息(如化学分子结构,蛋白质等)来得到药物的特征表示,由于没有充分利用生物医学对象信息,因此得到的药物特征无法表示药物之间丰富的语义关系。除此之外,大多数方法是基于单视图的,如何使用多视图嵌入的方法整合不同生物医学视图以得到语义更加丰富的药物特征表示,是一个极具挑战性的问题;(2)目前大多数DDADR预测方法过度依赖标记数据,然而人工标记医药数据的成本极高。如何构建一个基于对比学习的DDADR预测模型以减少对标记数据的依赖,也是值得研究的问题;(3)基于对比学习的DDADR预测模型受自身的训练模式限制,获得的药物特征表示质量不高。如何改进基于对比学习的DDADR预测模型以提高药物特征表示质量,从而提高预测精度是一个具有探究意义的问题。针对以上问题,本论文对DDADR预测问题和关键技术进行了研究,逐步深入地提出了一系列基于异构极性网络的DDADR表示学习方法。论文的主要创新成果如下:(1)提出了一种基于异构极性卷积网络的药物副作用预测方法(MS-ADR),以解决药物特征包含药物语义信息不够丰富、基于单视图预测模型效果不佳的问题。首先,利用与药物相关的多源生物医学对象信息和已知的DDADR信息,构建药物异构极性网络,并在其中应用结构平衡理论进行符号传播,进一步丰富药物之间的语义信息;其次,对药物异构极性网络进行图卷积编码,获得包含高阶语义信息的药物特征表示;最后,构建一种新型的基于深度学习的特征融合框架,将不同的生物医学视图信息嵌入到编码结构中,获得多源药物特征表示以进行DDADR预测任务。此成果形成了后续研究的框架基础。(2)提出了一种基于异构极性网络对比表示的药物副作用预测方法(DMVDGI),以解决目前大多数DDADR预测方法过度依赖标记数据的问题。首先,利用图卷积编码器获得药物正局部特征表示和药物负局部特征表示,并且利用全局表示编码器获得药物全局表示;其次,通过最大化全局表示-正局部表示之间的互信息,同时最小化全局表示-负局部表示之间的互信息来不断优化模型,获得最优的药物特征表示;最后,通过语义级注意力机制对不同生物医学视图中的药物特征表示进行融合,获得多源药物特征表示以进行DDADR预测任务。与MS-ADR模型(成果1)相比,降低了模型对标记数据的依赖度。此成果是后续优化研究的基础。(3)提出了一种基于异构极性网络有监督对比表示的药物副作用预测方法(SCLADR),以解决基于对比学习的DDADR预测模型获得的药物特征表示质量不高的问题。首先,采用有监督对比学习方法微调DMVDGI模型(成果2),利用稀疏的标记数据,在对比损失的基础上加入交叉熵损失来训练模型;其次,利用隐式图神经网络(Implicit Graph Neural Networks,IGNN)编码药物的多源语义特征,使获得的药物特征表示具有全局性;最后,采用端到端可训练的方式产生负样本,而不是以一种固定的方式产生负样本。这些改进显著提升了药物特征表示质量,从而提高了DDADR预测精度。本论文在Decagon模型的数据集、Drug Bank、SIDER和OFFSIDES数据集上进行了丰富的实验,并且采用多项指标进行评估。实验结果表明,本论文提出的一系列模型效果在DDADR预测任务中优于目前一些最好模型,实现了DDADR的有效预测,有助于治疗方案的制定和提高新药研发效率。
其他文献
行人重识别是视频监控系统中的重要任务,旨在从跨区域的监控摄像头采集到的图像中检索出特定行人的所有图像或视频,实现目标行人重识别,并应用于安防建设、行人追踪和轨迹分析等相关任务中。由于巨大的研究和应用价值,行人重识别成为近年的研究热点。但摄像头分辨率和安装角度、行人行走姿势及光照差异等复杂因素,给行人重识别带来了挑战。本文基于深度特征嵌入对行人重识别进行研究,分别讨论了在可见光图像场景与在可见光和红
学位
随着互联网技术和移动终端的快速发展,多模态数据呈现出了爆炸式的增长趋势。如何准确且高效地检索这些多模态数据,以满足用户日益复杂的多模态检索需求,变成了一个重要挑战。无监督哈希技术具有良好的扩展性、低存储空间和高检索效率,它可以有效地用来支持大规模多模态数据的检索。现有的面向多模态数据的无监督哈希方法主要包括无监督跨模态哈希和无监督多模态哈希两种。无监督多模态哈希利用多模态数据之间的互补性信息,将它
学位
虚拟现实通过为用户提供视觉、听觉以及触觉等多感官的信息模拟与刺激,利用计算机生成能使用户沉浸其中的模拟环境。在虚拟场景中,如果用户能够以真实的行走方式漫游,可以极大的提高体验感和沉浸感。但是,往往真实空间受到场地大小和形状的限制,与虚拟场景的开放性相冲突。如何在尽可能小的真实空间中漫游大型虚拟场景是该领域的研究难点和热点。在虚拟场景中随意漫游的同时,保证用户在真实空间中减少碰壁次数、降低漫游时间和
学位
[目 的]通过上尿路结石患者的结石成分分析、代谢评估、尿路影像学检查,查找结石形成的相关病因,为预防治疗的开展提供临床依据。[方法]对2018年9月至2021年9月在我院接受治疗的374例上尿路结石患者进行代谢评估、结石成分分析和影像学检查,查找患者在代谢和尿路解剖方面存在的异常以及代谢异常的类型,分析结石成分与代谢异常的关系和结石形成与解剖异常的关系,明确每个患者结石形成的相关病因。[结 果]3
学位
近年来,作为一种新的出行方式,共享单车逐渐走进了大众的生活,有效地解决了居民出行的最后一公里问题,现在已经成了许多人出行必不可少的一种交通工具。然而,在实际运营过程中,共享单车系统也不可避免地存在一些问题,影响了用户的使用体验,其中一个突出的问题是许多共享单车站点的自行车供需不平衡。准确预测共享单车系统中的共享单车使用量有助于解决这个问题。基于这个动机,本文对如何有效提高共享单车系统中自行车使用量
学位
模糊认知图(Fuzzy Cognitive Maps,FCMs)作为模糊逻辑和神经网络相融合的产物,通过模糊反馈动力系统进行知识表示和因果推理。近年来,该智能模型已被广泛应用于医学诊断、管理决策、时间序列预测等诸多领域。并且,模糊认知图凭借其自身带有反馈机制的多输入/多输出图结构,在描述、预测、控制复杂非线性动态系统中有出色表现,也成为机器人、无人机等智能体控制领域的研究热点。但现有工作主要集中在
学位
家庭教育具有重要的教育功能,是学校教育、社会教育的基础和保证。2022年1月1日起开始实施的《中华人民共和国家庭教育促进法》规定,未成年人的父母或监护人应该和幼儿园、中小学校等密切配合,积极参加其提供的公益性家庭教育指导和实践活动,应当针对不同年龄段未成年人的身心发展特点,围绕子女的德智体美劳众多内容为指引,开展家庭教育。高质量的家庭教育要求家长应该拥有正确的家庭教育理念,自觉学习家庭教育知识,掌
学位
新冠肺炎的爆发,引发了人们对医疗健康问题的高度重视。有效的医疗调度对医疗事业的发展有重要的意义。论文在考虑体检者的准备时间和体检者在体检设备之间的切换时间的基础上,将医疗调度问题建模为柔性作业车间调度问题(Flexible job shop scheduling problem,FJSP)。针对医疗调度过程中的体检调度、门诊调度、手术调度问题,分别建立了混合整数线性规划(Mixed integer
学位
随着物联网(AIoT)的发展,各种各样的终端设备生成的视觉数据越来越庞大。这些视觉数据不仅需要供人类观看或理解,还会用于多种机器分析和决策任务,例如智能监控、自动驾驶等其他智慧城市中的应用。而传统图像编解码器往往仅针对人类视觉任务所设计,在图像编解码过程中会产生大量的压缩伪影,如模糊、块效应等,这些压缩伪影不仅会影响人类的视觉体验还会导致后续机器视觉任务性能的严重下降。与传统地图像编码方法相比,针
学位
随着网络服务的迅速发展,“信息过载”的问题经常出现:例如在电商平台,用户面对海量的物品列表应该如何做出选择,而企业又应该将哪些信息展示给用户,这类问题引起了专家学者的广泛关注。推荐系统应运而生,它在处理信息过载方面起着至关重要的作用,并广泛应用于各个领域,取得了巨大的经济效益和社会效益。基于矩阵分解的协同过滤根据用户与物品的历史交互挖掘潜在特征实现个性化推荐,是实现推荐的有效算法。然而,大规模的用
学位