复杂网络社区发现算法研究

来源 :华中师范大学 | 被引量 : 4次 | 上传用户:xiaojia1118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将实体视为节点,实体之间的关系视为边,现实世界中的很多系统就可通过网络的形式来呈现,如学术论文及它们的引用关系可构成引文网络,网页及连接网页的超链接可形成万维网等。在这些系统(或网络)中,实体之间的关系通常较为复杂,表现出如小世界、无标度、自组织以及社区结构特性等简单网络所不具备的诸多性质,因此它们也被称为复杂网络。在复杂网络中,具有“与内部节点连接较为紧密,与外部节点连接较为稀疏”特征的节点的集合被称为社区。社区发现是复杂网络领域的一个研究热点,具有广泛的应用价值。例如,社区发现可对“引文网络中关联较紧密论文构成的社区”进行挖掘从而实现同领域论文的推荐,对万维网中的网页进行社区挖掘则可对相似主题的网页进行聚类进而实现热点事件的跟踪等。目前,国内外针对社区发现已经做了一些研究,提出了很多算法,如基于介数分割的算法、基于模块度优化的算法、基于谱分析的算法等。这些算法对社区发现研究的发展具有十分重要的意义,但它们仍存在诸如时间复杂度高或分辨率限制等问题。考虑到社区发现在实际应用中的重要性以及已有算法的不足,本文对其进行了深入研究。主要研究内容包括:一、对社区结构的增强机制进行了研究,提出了基于信息传播相似性的增强方法。社区结构增强的目的是将社区的轮廓进行一个初步呈现,为后续社区发现提供良好的数据基础,进而提升其准确性。文献中已有算法大多通过计算连边两端节点的相似性,并将该相似性值作为连边权值来实现社区结构的增强。但是传统的节点相似性计算方法仅考虑了共同邻居的个数,而未考虑邻居之间的连接关系。为了充分考虑连接关系对节点相似性的影响,本文引入了信息传播机制的思想,设计了一种基于分层结构的传播扩散模型对传播影响力进行了评估,并将信息传播的相似性测量值作为连边权值对社区结构进行了增强。实验表明,与传统方法相比,本文给出的社区结构增强方法能够更为有效地对社区轮廓进行呈现。二、在全局社区发现方面,针对模块度优化类社区发现算法中固有的分辨率限制问题,提出了一种通过调节增强程度来实现分辨率控制的方法。该方法首先对连边增强程度的差异性分量进行抽取,然后通过设定的增强因子将该分量与连边的原始权值进行混合,实现了可调节的社区结构增强。在利用加权模块度方法进行优化求解中,不同的增强因子对应着社区轮廓的不同凸显程度,因而社区的识别粒度也相应不同,从而实现了分辨率的可控性。实验表明,该方法可在一定程度上对分辨率限制问题进行缓解。此外,还提出了社区核心与连边增强权值相对应的假设,基于该假设,对社区中具有较高内聚性的凝聚子群进行了提取,并通过对凝聚子群进行基于模块度的局部优化和合并操作实现了社区结构的挖掘。实验表明基于凝聚子群扩展的社区发现算法具有较高的准确性。三、在局部社区发现方面,提出了基于弱化干扰节点的社区发现算法和基于凝聚核心扩展的社区发现算法。在基于弱化干扰节点的方法中,利用CnllLocal算法可能遗漏源节点的特点,将不包含源节点的邻居社区在社区发现过程中所起的干扰作用进行了弱化,提高了找到源节点实际隶属社区的可能性。在基于凝聚核心扩展的方法中,利用社区核心与连边增强权值相对应的假设,首先找到凝聚子群的核心,然后利用该核心取代源节点进行局部社区的扩展。实验表明,无论源节点处于社区核心还是边缘,该算法的效果都优于Bagraw、Clauset、CnllLocal等经典算法。本文的创新点主要在于:一、提出了基于信息传播相似性的社区结构增强方法,该方法充分考虑了节点之间的连接关系对节点相似性的影响,使社区结构增强的结果更具合理性。二、提出了通过调节社区结构增强程度来实现分辨率控制的方法,该方法能有效缓解分辨率限制问题。三、提出了连边增强权值(经过社区结构增强后的连边权值)与连边的社区核心性相对应的思想,基于该思想能实现对凝聚子群以及社区核心的抽取,从而提高全局以及局部社区发现的准确性。本文以复杂网络社区发现高效算法为主要目标,开展了社区结构增强、全局社区发现以及局部社区发现的相关算法研究,进一步发展了社区发现算法。计算实验表明,本文提出的社区发现算法具有准确性较高、时间复杂度较低的优势,为包括在线教育在内的众多领域中涉及到关系聚类的社区发现应用提供了理论基础。
其他文献
目的探索一种适用于电刺激抗癫痫参数筛选的大鼠模型。方法实验收集了麻醉状态下13只SD大鼠躯体感觉运动皮层的脑电信号。致癫药物戊四唑用以诱发并维持癫痫发作状态。在给予
永磁同步发电机构成的直驱型变速恒频风力发电系统通过全功率变流器与电网连接,当电网发生严重故障时,不仅对HVDC设备造成损害,甚至可能影响风力发电系统的整体安全稳定运行
新课标在2003年实验版基础上做出修订,更符合新时代新形势教学客观实际。但由于地区的差异性,新课标在全国各地落地的过程中都会遇到这样或那样的一些困难。笔者就山东省潍坊
<正>藤编家具的选材用料在传统概念中是原生态之天然物料的手工运用。手工技艺表现出一种心灵手巧的智慧,编织技法则将图案之美表现得生动传神!藤条在工匠们的掌中左右穿越、
期刊
随着信息技术的快速发展,医院管理信息化建设也日益完善,极大提高了医院日常管理效率。不过计算机网络系统需要一个稳定安全的状态,才能保证医院信息系统的安全性。为此,加强
对一水草酸钙进行热重测试,分析了升温速率、试样填充量以及气氛等因素对热重曲线的影响。
随着我国科学技术的不断发展,由于钢混组合结构能够同时发挥钢材和混凝土两者的各自优点,并以其优异的力学性能,已经被越来越多的房屋结构所釆用。钢混组合结构组合结构能否
卵形鲳鲹(Trachinotus ovatus)是我国重要的海水养殖鱼类,经济价值极高,但近年来各种鱼病频繁爆发造成了巨大损失。为探究广西莪术(Curcuma kwangsiensis S.G.Lee et C.F.Lia
介绍了强化混凝技术的原理及影响因素,并针对强化混凝技术在污水处理中的应用情况进行了综述分析,最后指出了强化混凝技术需要加强的几个方面。
虚拟演播室是虚拟现实技术在电视制作领域中的一项崭新应用.针对基于机电跟踪的三维虚拟演播室系统,重点讨论了摄像机机电跟踪、摄像机校准和初始定位、虚拟背景生成,以及系