社会网络社区发现方法研究

来源 :天津科技大学 | 被引量 : 0次 | 上传用户:jisenboss02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
客观世界可以被抽象成不同的复杂网络,其中个体及个体之间的关联关系可以依据设定的规则抽象为图中的节点和节点间的边。社区结构是复杂网络的一个重要属性,社区内部节点连接稠密而社区间节点连接稀疏。通过寻找复杂网络中的社区结构可以发现网络蕴含的规律,并可以预测网络演化趋势,所以复杂网络社区发现一直是研究的热点之一。  近年来,社区发现研究已经取得了长足的进步,国内外学者们提出了各类不同的理论和方法。但是,这些算法一般需要先验知识或者时间复杂度过高。标签传播算法(LPA)作为近年来新兴的一种快速划分方法,不需要知道网络的整体信息或者先验社区结构,运行速度快,仅具有线性的时间复杂度,且准确率高。但是,传统标签传播算法在标签传播过程平等对待每一个标签,随机更新标签,所以该算法的稳定性有待进一步提高。  为抑制标签传播算法中标签传播的随意性,本文提出了一种基于随机游走的标签传播社区发现算法,研究工作主要包括以下三个方面:  (1)随机游走算法改进。原始的随机游走算法中只有一个游走的种子,文中称之为walker,但是,由于随机游走算法本身存在的随机性,产生的结果有很大的不确定性。为提高结果的准确性和鲁棒性,本文提出可以连续不断释放多个walker的随机游走算法,即在给定的时间内,每间隔一个单位时间释放一个walker。通过walker运动路径在两点间可达的概率,得出两个节点间的相似度,进而求得网络中所有节点间的相似度矩阵。  (2)提出了基于随机游走相似度矩阵的标签传播社区发现算法。原始标签传播过程中,当邻居节点中标签出现频率存在多个最高时,将会随机选择一个最高标签,由于标签传播的随意性导致算法结果的不稳定。为此本文提出一个基于随机游走相似度矩阵的标签传播社区发现算法,即在标签传播过程中引入相似度矩阵,当遇有相同的最大邻居标签数时,不再随机选择标签,而是通过查找相似度矩阵,找到相似度最高的邻居节点,将自身更新为与该节点相同的标签,避免了标签在社区之间的任意传播。  (3)确定随机游走过程中步数t的取值。计算相似度矩阵过程中,选取不同的步数t所得到的节点间相似度也不同,进而影响网络社区划分结果。本文通过对两个指定网络的划分,得到t的合理取值范围。选择t=4作为实验中的合理参数。  (4)实验验证。采用真实网络和基准网络对本文提出的算法进行了测试,通过基于随机游走的标签传播算法与传统算法的划分结果对比,验证改进算法的准确性、适应性等方面性能。实验结果表明,基于随机游走的标签传播算法取得了更好的表现。
其他文献
中国手语合成系统旨在为聋人教育,聋健间的无障碍交流创造环境与基础,它利用人工智能,计算机图形学等技术,实现用三维虚拟角色演示用户指定的中国手语。系统的成功研发,为聋
近年来,随着互联网技术和视频技术的研究发展,网络上的视频数量越来越多,想要在海量的视频数据中准确提取自己所感兴趣的视频数据也是一个困难的事情,因此视频的检索技术应运
近年来,乳腺癌已经成为困扰女性身体健康的最常见的恶性肿瘤之一,如果治疗不及时还会危及生命。统计发现,若能及时诊断和治疗,患者的生存率在90%以上。乳腺钼靶 X线摄影检查是
移动手持设备的飞速发展,无线网络的全面覆盖,使得各种应用,尤其是多媒体应用,如视频,图片等,越来越多的进入到无线网络,如何提升多媒体数据在无线网络中的传输性能,成为了一
手写汉字识别是指将用户在设备上的书写笔迹记录并转化成最终汉字内码的过程,其中涉及到信息规整、模式识别等过程。手写汉字识别的难度主要体现在汉字集的庞大、用户各异的
功能加密扩展了身份基加密和属性基加密的概念,在方兴未艾的云计算架构下能够用来达成细粒度访问控制和计算正确性验证等重要安全目标.因此,追求更加高效、更加安全的功能加
当前,随着移动互联网的迅速发展,越来越多的移动设备,譬如手机,掌上电脑(PDA)等在日常生活和工作中被人们广泛的使用。而且,智能手机在国内的普及又带动了移动数据同步技术的
随着科学技术的快速发展,计算机相关硬件的普及和用户使用计算机水平的提高,利用计算机网络技术,运用电子公文管理系统采用数字化办公已被广泛使用。目前政府机关和企事业单
基于自编码神经网络文本特征提取,主要目的是对当前文本挖掘的效率进行提升。由于现在网络的高速发展,大量的信息尤其是文本为主的信息在网络中大量传播,使得原有的文本挖掘技术
近一二十年,随着计算机相关技术的发展,计算机图形学有了突飞猛进的变革,三维图形学在各领域的应用越来越广泛,另一方面,图形学在这些领域不断深入应用也对图形学本身提出了