基于拓扑相似性和优化PPI网络的疾病基因预测方法

来源 :湖南大学 | 被引量 : 0次 | 上传用户:emmajqf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
许多疾病,如糖尿病、癌症、心血管疾病等都与基因有密切的关系,不管是在发达国家还是发展中国家,这些疾病都越来越流行。如何阐述人类遗传疾病和基因之间的关系逐渐成为了当今系统生物学中的一个重要而新兴的话题。研究表明,导致同一种疾病或者表型相似的疾病的基因,在基因的相互作用网络中更趋于产生相互作用。而由于蛋白质是由基因编码而成的,因此可以将基因的作用关系对应到蛋白质的作用关系上。因此,大量的疾病基因预测方法开始基于蛋白质相互作用网络(protein-protein interaction network,PPI)来进行研究。但是由于某些蛋白质的相互作用关系不明确从而导致蛋白质互作网络并不能完整的描述蛋白质的关联关系,蛋白质互相作用网络的数据不完整性是造成预测准确度不能进一步提高的重要原因之一。为了克服这一缺陷,本文根据引入了基因本体论数据、表型相似性数据和基因-表型关系数据对PPI网络和随机游走算法进行补充,提高随机游走算法在蛋白质互作网络中的排序性能。首先,利用基本本体论数据进行语义相似性计算并对PPI网络进行数据补充;然后,基于基因和表型对应关系和表型相似性网络生成一个新的异质网络,在该异质网络中以疾病的已知致病基因作为种子节点游走,游走结束后,根据对基因排序情况选择若干种子基因。最后,以已知致病基因和这几个候选种子基因作为种子节点,并且以第二步中的游走结果作为对应种子节点的初始权重在优化后的蛋白质相互作用网络中进行二次随机游走从而得到最终预测结果。该方法本质上是通过引入其他生物信息学数据对蛋白质互作网络进行补充从而克服数据不完整性的问题。综上所述,本研究提出了基于基因本体数据优化的蛋白质相互作用网络进行随机游走的方法,并且根据基因-表型关系网络来设置随机游走的中子节点的初始权重。通过引入基因本体论数据和基因-表型关系来补充PPI网络中关联较弱的关系,最终提高预测效果。
其他文献
研究生思想教育在我国思想教育体系中占据着重要的地位。加强研究生思想教育,提高研究生的整体思想素质,已经成为新时期高校思想教育的一个新课题。与本科生思想教育不同,研
就现金管理在制度建设、结算渠道、金融机构经营方式、制度落实、监控手段、信息滞后等方面存在的问题,从现金管理制度出发,结合我国现阶段经济体制的确立、社会经济的发展规模
让办事者“只用跑一次”,是我省深化“放管服”改革、改善营商环境而提出的硬指标。2月23日,吉林省人民政府发布了《全面推进“只跑一次”改革实施方案》,提出2018年4月底前全省
报纸
目前,我国的中小企业已超过1000万家。占我国企业总数的90%,提供了75%的城镇就业机会,实现工业总产值占全国的60%,对我国经济增长和社会发展起着举足轻重的作用。然而。我国一些中小
电动自行车故障分两类:一类为柔性故障:所谓柔性故障,指的是有时候出现,有时候不出现,或者说故障发生没有明显的规律可循。如控制器中的康铜丝脱焊,有时接触好,电机正常运行;有时接触
电子商务加速了我们周围世界的数字化进程,一个全新的、充满机遇与挑战的数字化世界正逐渐演变为现实,越来越清晰,几乎触手可及.本文对电子商务、中间件及COM的应用进行了探