论文部分内容阅读
由于理想的生物标志物可以有效地标记器官、组织、系统、细胞结构或功能的改变或潜在发生改变的生化指标,对于疾病的预防、诊断、监控、预后和治疗起到非常重要的作用。近几年来,越来越多研究表明microRNAs(非编码单链RNA分子,miRNAs)和微生物在很多基本的生物过程中有着重要的作用,其中之一便是致病作用。所以尝试从miRNAs和微生物中寻找和发现潜在的理想生物标志物成为了目前研究的一个热点问题。然而仅依靠昂贵且耗时的生物验证实验是远远不够的。随着各种各样的生物型数据集的公开,人们开始利用计算机模型从不同角度去预测潜在的miRNA与疾病以及微生物与疾病的相互关系,从而挑选出高相关性的候选关系对优先进行实验验证,从而大大加快优质生物标志物的发现,以及促进对各种人类复杂疾病发病机理的理解。本文主要工作包括:(1)对所需生物数据集进行获取与收集,通过数据清洗和预处理后,从中通过相关计算方法计算出疾病语义类似性,miRNA功能类似性以及高斯作用谱核相似性。(2)提出基于路径的miRNA与疾病关联关系预测模型PBMDA,其主要原理是构建双色异构计算网络,然后基于这一网络采用一种特殊的深度遍历搜索算法给所有潜在的关联关系对打分,分数高的关联关系对将被视为最有可能的候选集合。(3)提出基于拉普拉斯正则化最小二乘法的微生物与疾病关联关系预测模型LRLSHMDA,其主要原理是进行拉普拉斯正则化运算,构造最小化微生物与疾病的成本函数,优化分类器,最后把这两类分类器转化到同一的计算空间计算出潜在关联关系对的概率值。本文通过留一交叉验证,五折交叉验证以及案例分析对这两种模型的预测结果进行验证。其验证结果表明本文提出的两种计算模型具有可靠的预测性能,比同类计算模型更准确,更稳定,能为该领域的后续研究工作提供借鉴。