基于数据集平衡与二部图模型的药物靶点关系预测

来源 :河北大学 | 被引量 : 0次 | 上传用户:g56410029uoyuhao1995
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物靶点关系是药物研发过程中不可缺少的信息。因此,药物靶点相互作用相关的研究已经成为药学研究的热点。传统的实验方法验证药物靶点相互作用关系效率很低,需要花费大量的时间和精力,并且费用也十分高昂。这大大制约了药物的研发速度,阻碍了医学技术的进步。随着科学技术的发展,越来越多的专家学者利用计算机技术辅助药物靶点关系的预测,极大地提升了实验效率,缩短了药物研发的周期。现有的药物靶点关系研究中主要存在两大问题。首先,传统二部图模型的研究中大多认为未知相互作用的药物靶点对之间不存在相互作用关系。实际上,未知相互作用的药物靶点对之间是否存在相互作用关系并未被证实。如果直接将未知相互作用关系的药物靶点对当作不存在相互作用,可能会影响预测的准确率。其次,现有已知阳性样本占比较小,数据库中的阴性样本较多,导致现有药物靶点数据集存在失衡问题,严重影响了预测性能的提升。针对上述问题,本文将未知相互作用关系的药物靶点对看成是未标记样本,通过多源信息加权融合模型和协同过滤的方法对原有的数据集进行修订,然后,采用修订后的数据集利用二部图模型进行预测,提升了预测效果。具体研究内容如下:(1)基于多源信息加权融合模型的药物靶点预测针对传统二部图模型数据集存在假阴性样本的问题,本文提出一种基于多源信息加权融合模型(Multi-Source Information Weighted Fusion Model,MSIWF)的药物靶点预测算法。首先,从未知相互作用关系的药物靶点对中筛选出一部分可能存在相互作用的药物靶点对。其次,将这些药物靶点对加入到阳性样本中,视为已知存在相互作用关系,并对原始相互作用关系矩阵进行修订。采用修订后的数据集,利用二部图预测模型进行药物靶点之间的关系预测。实验结果表明该模型在特异度、灵敏度、精确率、准确率和F1度量等指标上表现优异,提升了传统二部图模型的预测性能。(2)基于协同过滤平衡数据集的药物靶点预测针对现有数据集样本失衡的问题,本文提出了一种基于协同过滤平衡数据集(Balance Datasets Based on Collaborative Filtering,BDCF)的药物靶点预测算法。本文在多源信息加权融合模型修订的数据集基础上,采用协同过滤算法平衡数据集,利用二部图模型进行药物靶点关系预测。本文提出的基于协同过滤平衡数据集的药物靶点预测模型在特异度、灵敏度、精确率和准确率方面,与MSIWF预测模型相比均有所提高。实验结果表明,与现有最新的药物靶点预测方法相比,本文算法在接受者操作特征曲线下面积(Area Under Roc Curve,AUC)、精确率-召回率曲线下面积(Area Under Precision Recall Curve,AUPR)等指标上表现优异。
其他文献
近年来,情绪识别作为脑机接口中的研究热点课题之一,受到了全世界的关注,并且在疾病诊治、心理调节、军事创伤恢复等诸多领域得到了广泛的应用和研究。相比基于文本或图像情绪识别,基于脑电信号的情绪识别的方法更具可靠性和稳定性,在情绪研究中扮演着越来越重要的角色。但脑电信号本身具有信号复杂、冗余信息干扰强、个体间差异大等特点,致使脑电信号中的情绪信息不能被充分利用,跨被试者情绪识别准确率较低。因此,如何充分
学位
脑疾病是脑科学研究热点。磁共振成像技术因其可获得多方向、多参数、高分辨率的组织结构图像,广泛应用于脑疾病诊断与治疗。脑疾病通常表现为脑组织病变,脑部主要由白质、灰质和脑脊液三大组织构成,研究脑疾病发病机制首先要分割三大组织,进行定性定量分析,然后提出治疗方案,实现医学智能诊断。目前,脑组织的分割常被归属于聚类问题,其中HDBSCAN(Hierarchical Density Based Spati
学位
大脑是人体中的重要器官,核磁共振成像(Magnetic Resonance Imaging,MRI)对脑部软组织成分显像清晰,三维(Three Dimensions,3D)脑MRI图像单模配准算法的研究对临床应用有着重要价值。传统方法精度较高,但普遍存在算法复杂度高、配准时间长和普适性差的问题。深度学习方法精度高、实时性强,但大多忽略了配准的微分同胚性。基于对称微分同胚网络(Symmetric D
学位
阿尔茨海默症(Alzheimer’s Disease,AD)属于神经退行性疾病,其主要症状是记忆力、认知功能下降以及语言能力减弱等。轻度认知障碍(Mild Cognitive Impairment,MCI)是正常和痴呆之间的一种过渡阶段,其临床主要表现是记忆以及认知功能较常人存在轻微受损,但没有完全被确定为AD。MCI被认为有极大的可能最终转化为AD,然而目前仍然缺乏针对AD的有效生物标志物。功能
学位
高光谱图像(Hyperspectral Image,HSI)是一种由数十个或数百个波段构成的数据立方体,相对于传统的RGB图像或多光谱图像(Multispectral Image,MSI)而言,它包含了丰富的光谱信息,可以更好地反映地物的实际情况。而由于光学成像原理的限制,HSI空间分辨率相对较低,这限制了HSI后续的分析与应用。在这种情况下,融合高空间分辨率(High Resolution,HR
学位
甲基法尼酯(Methylene farnesoate,MF)是存在于甲壳动物体内一种十分重要的内分泌倍半萜类激素,其主要作用包括调控甲壳动物蜕皮、生长发育与繁殖等过程。然而,在甲壳动物中,甲基法尼酯如何运输到靶器官从而发挥作用尚未清晰。本研究以凡纳滨对虾Litopenaeus vannamei为研究对象,通过生物信息学整合凡纳滨对虾基因组与转录组的数据信息,筛选到了11个Juvenile horm
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)以其独有的全天候、全天时成像特点,在军事和民用方面有众多的研究和应用,如:军事测绘、海洋监测、资源勘探等方面。然而,受相干成像机制的影响,SAR图像会带有相干斑噪声,该噪声的存在降低了SAR图像的信噪比,使图像中的目标信息受到遮挡,从而严重地影响了图像质量,模糊了图像中的重要信息,为后续进行SAR图像高水平处理任务带来巨大的挑
学位
孤独症(Autism Spectrum Disorder,ASD)是一种神经系统疾病,常发病于婴幼儿早期,症状包括行为方式刻板和认知方式局限等。目前,主要是医师参考量表对ASD进行诊断,方法主观性强且诊断效率低。因此寻找客观生物学标志物对ASD诊断具有重要意义。本文基于递归图(Recurrence Plot,RP)提取ASD儿童八通道脑电信号(Electroencephalogram,EEG)特征
学位
SDN解耦了数据平面和控制平面,具备网络可灵活配置的优势。SDN网络状态的全局可见性和流量转发规则的运行操作使得任何冲突都可以通过逻辑上集中的控制器远程解决,增强了网络的稳定性。但同时,控制器的集中化及其可见性使得网络更易受到攻击,为恶意攻击创造了更多的机会。DDoS攻击会对SDN网络造成毁灭性打击,这是一个非常严重的问题。论文对此问题,从检测、负载均衡以及攻击溯源三个方面进行研究。所做的工作主要
学位
近年来,脑血管疾病的患病人数急剧上升,特别是脑卒中患者在治疗后普遍存在的不同程度的运动功能障碍,给家庭和社会带来极重的负担。及时而有效的康复治疗能够最大程度地恢复患者运动能力。而对脑卒中患者运动神经系统功能状态进行准确评估是提高康复治疗效果的基础。皮质肌耦合(corticalmuscular coupling,CMC)能够揭示大脑皮层和运动肌肉组织两大系统之间的信息传递和功能联系,可以用于研究神经
学位