论文部分内容阅读
药物重定位(Drug Repositioning)是为已有药物寻找其新的适应症的方法,可有效缩短药物研发周期、降低成本、规避风险。随着近年来相关研究的积累以及药物数据库的开放使用,基于计算的药物重定位方法已成为重要的研究方向。一方面,部分疾病的发生和发展与基因的异常有关,药物分子通过在体内与靶标(如蛋白质)结合达到治疗效果,研究者利用药物、疾病同靶标的关系数据可探索更有效的、潜在的药物-疾病关系;另一方面,已知药物和疾病关系相对稀疏,如何获得较高的药物重定位精度也是研究者关注的问题。本文在考虑已知药物-疾病关系的基础上,融合了靶标信息,提出基于药物-疾病-靶标异构网络的药物重定位算法。本文的主要研究工作如下:为了寻找出疾病和药物的关联关系,提出一种基于异构网络信息传播的药物重定位算法(Information Propagate in Heterogeneous Networks,IPHN)。构建已知的药物、疾病和靶标信息异构网络,利用元路径上的关联性测量(Relatedness Measure,RM)计算不同类型节点(药物、疾病和靶标)之间的相似性,更新网络边权值,构建随机游走的转移概率矩阵。利用网络内随机游走和网络间随机游走的方法,实现从药物网络到靶标网络再到疾病网络,以及从药物网络直接到疾病网络的药物关系概率分值传播,按照最终概率分值的大小,把与给定疾病不存在已知关联的所有药物进行排序,从而为给定疾病推荐新的治疗药物。经过十折交叉验证结果表明,本文提出的IPHN算法在AUC和AUPR值上相对于比较算法有优势,案例分析的结果也表明了IPHN算法的有效性。为了解决已知药物和疾病关联关系稀疏特征对算法性能的影响,进一步提出基于图正则化的直推式回归药物重定位算法(Graph Regularized Transductive Regression,GRTR)。首先将疾病看为标签,药物和标靶看为对象,基于药物、疾病和标靶组成的异构网络,统计邻居药物节点可作用的疾病信息分布,得到无标记对象与疾病的初始的关联关系;然后将无标记数据和有标记数据作为输入,通过构建的适应稀疏特征的图正则化直推式回归模型,对药物与疾病关系的相关性概率分值进行迭代更新,以挖掘出更多的药物与疾病的强关联关系。实验结果表明GRTR同对比算法相比有较高的AUC和AUPR值。此外,在算法结果中可以同时得到药物和靶标之间预测结果,对药物-疾病关系和疾病-靶标的案例分析也验证了GRTR的有效性。