基于蛋白质相互作用的概率网络模体发现算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:qyxiao3771
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生命科学领域高通量实验的发展,人们得到越来越多有关蛋白质结构和功能的生物数据,生命科学的研究重点从解码基因组慢慢转变到对蛋白质的研究,进而探索生命进化的过程。蛋白质相互作用网络是生命活动中蛋白质功能关系的结构表现,网络模体是其基本组成结构,查找网络模体也逐渐成为研究蛋白质领域的热点问题。本文基于蛋白质相互作用网络,分析了网络模体的拓扑特性及统计特征,并总结了现有的关于网络模体查找的研究成果,分析这些算法的优缺点,并针对其中存在的一些问题,提出了基于蛋白质相互作用来寻找概率网络模体的新算法。概率网络模体是指生物网络中结构相似的一组子图,根据其结构特性,本文提出了AS-ESU子图抽样算法(Adaptive Sampling Enumeration Subgraph),这种算法根据复杂网络的拓扑特性,重新分配ESU搜索树中各枝干的抽样概率,提高了抽样稳定性,使抽样结果更具有原网络的代表性。随后又提出了基于多特征融合的子图比对算法,引入一种新的顶点匹配规则,使得查找的概率网络模体不仅从拓扑结构考虑,同时还考虑子图顶点的蛋白质类型。通过实验表明,这种方法可以识别出不同规模的多种概率网络模体。为进一步提高概率网络模体查找的准确性,本文从提高概率网络模体聚类的类内相似度角度出发,提出了一种新型的子图邻接矩阵转换0-1串的编码规则。这种方法结合蛋白质相互作用原网络中顶点度的全局信息和子图内部边连接的局部信息,对所有子图进行唯一的图编码操作。然后针对模体查找算法子图数目多和算法计算量大的难点,改进了确定概率网络模体的聚类过程。本文采用一种实时迭代更新类中心的聚类方法,动态更新候选概率网络模体信息使得子图分类更加精确。通过实验表明,这种方法在一定程度上提高了概率网络模体的类内相似度。
其他文献
即使在进行云迁移时存在许多大的挑战(例如:安全性和可靠性),但是实用的云计算解决方案已经成为IT领域不容忽视的事实;同时,许多研究者正在接受这些挑战。云计算是一种信息处理模
用分形思想模拟的自然景物在虚拟现实环境中的应用越来越广泛。而迭代函数系统(IFS)作为分形理论的一个分支,在一大类物体的建模问题中具有很大的优势,特别是对自然景物的计
云计算是当前网络技术领域的热门话题之一,是产业界、学术界、政府等各界均十分关注的焦点。在云环境下,网络数据分布呈现复杂化、多样化、动态化,对web服务安全提出了更高要求
物体形状轮廓的多边形近似是计算机视觉和图像分析领域的一个基础问题,相关算法已被广泛应用于形状匹配、目标识别、形状检索、形状编码等视觉与图像分析任务。本文首先概述多
无线传感器网络是由大量的传感器以自组织和多跳的方式构成的无线网络,实时协作地感知、采集、处理和传输网络覆盖地理区域内被感知对象的信息,并最终把这些信息发送给网络所有
非真实感绘制(Non-photorealistic rendering,NPR)是计算机图形学的一类。自20世纪90年代中期,非真实感绘制逐渐成为计算机图形学的研究热点之一。非真实感绘制指的是利用计算机
随着我国改革开放的深入和全面建设小康社会目标的实施,我国的经济实力和居民生活水平得到了大幅提高,人员和货物流动空前活跃,使道路建设和交通管理日显滞后。机动车的拥有
作为智能的交通系统的基础之一,车载自组织网络的目标是为移动车辆节点提供一个移动的通信平台,能够提高交通的通信效率、降低事故发生率,使得乘客都能方便的、快捷的接入到互联
随着信息时代的逐步推进,科学工作流得到了广泛的应用。特别是在科研领域的应用更是广泛,如天文学,高性能物理学等。由于科学工作流需要的数据规模很大,为了执行科学工作流,
随着国家教育体制的改革,教育信息化对高校的信息化管理建设不断的提出更高的要求。但由于信息化建设的速度往往跟不上信息化发展的速度,导致出现了以下问题,一方面,在招生规