基于子图支持度和分层抽样的网络模体发现算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:huangfei1117
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着后基因组时代的到来,生物组学研究深入发展,大量的生物网络数据涌现,有效地解析和分析这些网络数据是当前生物信息学的研究重点。网络模体是网络中一种有着不同局部结构特征的模块,在生物网络中具有重要的作用。大量算法被研究出来用于网络模体发现,由于网络模体发现计算非常复杂,抽样算法被用来减少网络模体发现的计算量,但是抽样算法不可避免的抽样误差影响抽样结果的正确性,是抽样网络模体发现中不可忽视的问题。本文致力于研究具有低抽样误差的网络模体发现算法。为了降低抽样误差,针对现有抽样网络模体发现算法在计算子图比例时采取同构子图简单计数的方法,本文提出了一种基于子图扩展和子图支持度的网络模体发现抽样算法——SE&SSV(Sampling Network Motif Detection Algorithm Basedon Subgraph Extending and Subgraph Support Value)算法。该算法采用子图扩展的方法进行同构判断,在扩展的过程中计算出一个衡量子图同构概率的子图支持度值(Subgraph Support Value, SSV),将子图支持度(SSV)用到子图浓度的计算当中,可以考虑到更多的网络拓扑信息。实验结果表明该算法具有较低的抽样误差和较高的稳定性。由于现有抽样网络模体发现算法中子图样本的选取通常采用简单随机抽样方法,而在相同样本容量情况下,分层抽样方法通常比简单随机抽样具有更小的抽样误差,更高的抽样精度。因此,本文提出一种基于节点度序列分布特征的网络模体发现分层抽样算法——SRand_ESU(Stratified Sampling Network MotifDetection Algorithm Based on Vertices Degree Sequence)算法。该算法将输入网络的节点度序列特征作为抽样分层的指标,根据不同的度序列分布特征选择合理的分层模型,可以有效降低抽样误差提高抽样精度。实验结果表明,该算法取得的子图样本节点度分布与输入网络节点度分布更加一致,并且能取得较好的抽样精度和稳定性。
其他文献
作为一种最友好的生物特征识别技术,人脸识别技术在安防监控、用户认证、人机交互等方面有着非常广泛的应用,已经得到了广大科学家的普遍关注,并涌现出了大量优秀的人脸识别
我国是棉花生产和消费大国,棉纺织行业是我国经济发展的支柱产业。棉花中普遍存在的异纤问题,使得加工后的纺织品存在纱疵,产品质量等级下降,影响企业的经济效益。人工挑拣劳动强
飞行器航路规划作为飞行器智能控制的关键技术之一,是提高飞行器作战效能和实现飞行器安全可靠飞行的前提。航路规划技术是在综合各种约束条件下寻找一条从起点到终点的最优路
随着网络技术的不断提高和应用领域的不断普及,网络攻击等恶意行为已经严重威胁了计算机网络的安全,网络异常行为会导致网络流量异常,因此能够及时准确的检测出网络异常对于维护
低密度奇偶校验(Low Density Parity Check,LDPC)码是由Gallager博士提出的一种性能优良的线性分组码。它克服了其它很多纠错码的缺点,是目前发现的性能最接近香农限的信道编
随着移动互联网的发展,基于位置的服务(LBS)受到了越来越多的关注,导航定位是其关键技术之一。全球卫星导航定位系统(Global Navigation Satellite System,GNSS)包括美国的GP
矿井通信系统是提升煤矿安全管理水平,促进煤矿安全生产的重要保障。研究矿井通信理论,改进矿井传输技术和手段,对于提高煤矿安全保障水平具有十分重要的理论意义和现实价值。煤
随着物联网、云计算与大数据等新兴互联网技术的迅速发展,信息安全已成为当今我国信息驱动社会的一个迫切问题。传统密码学的安全性完全依赖于加密密钥的安全性,并且加密密钥
随着信息技术的飞速发展,生物识别技术受到了越来越多的关注。其中人脸识别技术是一个重要的分支,它与指纹识别、虹膜识别相比具有直接友好的优点。因此,人脸识别技术在信息安全
本论文的研究工作系国家自然科学基金项目“基于物体棱线线流场的三维物体运动估计与结构重建研究”(61165011)的一部分。视觉运动分析是计算机视觉领域的一个重要课题,主要研