基于局部拓展的重叠社区发现算法研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wzq8013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网的快速发展生成了大量的数据信息,这些数据相互关联形成了复杂系统。复杂系统通常被抽象成复杂网络来进行研究,将系统中的成员看作网络中的节点,相同属性的节点聚集在一起形成了社区结构。探究社区结构的社区发现算法,可以帮助我们更好的理解网络属性和功能。在真实网络中,一个节点可能同时属于多个社区,这些社区称为重叠社区。本文主要对局部拓展类的重叠社区发现方法展开研究,并将算法应用于犯罪嫌疑人网络。本文的主要研究工作和创新点如下:(1)针对经典的局部拓展类重叠社区发现算法LFM算法划分结果不稳定、拓展过程可能出现死循环、社区划分后重叠小规模社区过多造成结果不准确的问题,提出了一类基于局部拓展的重叠社区发现算法(SLFM)。首先,为了缓解原算法随机选择种子导致的划分结果不稳定的问题,本文算法分别引入表示网络节点中心性的度中心性、介数中心性、接近度中心性和特征向量中心性作为衡量节点影响力的指标来选择初始社区;其次,算法给移出社区的节点增设标记位以避免算法本身可能存在的死循环问题,并对重复比对邻居节点的适应度函数过程进行剪枝,减少算法的运行时间;最后,为了解决LFM算法生成过多的重叠小社区,提出基于互信息的社区重叠度计算公式,对划分后重叠度较高的社区进行合并。在4个真实数据集和10组人工数据集上和其他算法的对比实验表明本文提出的算法以模块度、F1-Score和NMI等作为评价指标时,具有较好的社区划分效果。(2)犯罪分子与同级或上下级成员接触而形成嫌疑人网络,采用传统的人海战术挖掘与已知的犯罪者相接触的人员身份往往消耗了大量人力物力,局部拓展类社区发现算法能够从一个节点找出网络中的社区结构,可用于犯罪嫌疑人重叠团伙划分来定义未知成员的身份。基于此,本文构建了一个识别潜在犯罪嫌疑人的社区发现系统,实现了嫌疑人网络矩阵构建、关键节点分析、潜在嫌疑人社区划分、种子拓展和社区拓展规模自定义、节点属性自定义和社区划分结果可视化功能,为刑侦人员和科研人员提供了一个便捷的学习研究工具。
其他文献
在无约束的环境下拍摄的人脸图像,往往会遭受一种或者多种的图像退化效果,导致人脸图像在视觉上遭受破坏,并且可能影响人脸识别等场景的使用效果。基于深度学习的人脸图像复原研究是最近非常流行的方向。然而,许多最近的方法存在着两个局限性:(1)许多最近的人脸图像复原方法聚焦在复原单一退化效果的图像,遇到多种退化效果出现时,往往不能够很好的应对,导致复原后的人脸图像视觉效果不佳;(2)绝大多数人脸图像复原方法
学位
伴随着我国GDP的不断增长,居民可支配收入的不断上升,满足物质需求之后,国人开始更多的关注如何实现资产的持续增值,于是越来越多的人开始把眼光投向高速发展的中国资本市场。家装行业是我国传统发展行业,近年来受到国家对房地产行业的严格管控、精装修住房政策推进、旧改政策、以及消费升级等多类因素扰动,该行业发生了巨大的变化,同行业内的公司开始朝不同方向发展。本文将通过理论及数据相结合的方式对目标行业进行分析
学位
沪港通以及深港通是我国资本市场开放的重要一步,自2014年11月17日内地证监会和香港证监会联合宣布沪港通政策正式实施以来,我国资本市场快速发展,对外开放程度逐渐扩大,在这些良性影响下,中国证监会进一步加大了资本市场开放,于2016年12月5日宣布深港通正式开通。深港通在沪港通政策的基础上加大了开放力度,标的股票更多样化。减小了对于资本的限制条件,更大程度上刺激了境外资本进入A股市场的热情。由于深
学位
文字作为表达人类思想和情感的符号,在日常生活中处处可见。因此,以文本信息作为主体内容的文本图像也十分常见。在真实场景中拍摄的文本图像,经常因为分辨率不足以及相机抖动、失焦等多种因素,造成图像严重降晰,即清晰度大大下降,视觉效果模糊。针对多种退化因素的降晰文本图像复原方法研究是重要的也是必要的。然而,近年来,文本图像复原研究大多只针对单一的降晰因素。本文研究了针对单张低分辨率和抖动/失焦模糊的降晰文
学位
目的 探究在接受肝癌根治术的原发性肝癌患者群体中,术前与术后不同时间循环肿瘤细胞(circulating tumor cell,CTC)、甲胎蛋白(alpha fetoprotein,AFP)测定值变化情况,并为患者远期预后评估及术后肿瘤复发的诊断提供实验依据。方法 选取诊断为原发性肝癌并接受肝癌根治术的患者为研究对象,分别在术前,术后4周、24周、48周检测CTC、AFP。按照术后48周内肿瘤复
期刊
我国经济体制从计划经济转型而来,证券市场经过三十年的发展,监管政策日趋完善,但相比欧美发达国家市场仍不成熟,具有政策市的特点,投资者的投资知识仍匮乏,跟风入场等“羊群效应”显著存在,加上近年来国内国外经济环境多变,2015年股灾、“三去一降”经济政策、中美贸易战、新冠疫情等都深刻影响着我国资本市场的走势。本文以经济政策不确定性,投资者情绪,股票收益率三者之间的关系切入,分析何种特征公司更容易受到经
学位
近年来,伴随着“营改增”的全面推进,地方政府失去了营业税这一地方主体税种,地方税收失去重要收入来源,而分税制改革后财权上移、事权下移,导致地方财力与事权支出不匹配,地方政府财政压力大,高度依赖土地财政,地方财政问题亟待解决。另一方面,伴随着我国房地产行业的发展,也产生了一些如房价泡沫、房产投机等问题,作为调控房地产工具的房产税迫切需要进行改革以促进房地产市场的协调有序发展。十八届三中全会首次提出“
学位
党的十八大以来,我国在材料、零部件、电子元件等领域取得了瞩目的成就,建立了工业类目齐全的产业体系,总体经济水平也升至世界第二。然而,我国制造业还处于大而不强的阶段,产业价值链分工在全球处于中后端,对于核心基础零部件(元器件)、关键基础材料、先进基础工艺和产业技术基础(简称工业“四基”)的关键技术还未充分掌握,大量高端产品的材料与技术供给需要依靠海外进口来满足。工业“四基”的发展水平对于我国产业的整
学位
由脂肪醇聚氧乙烯醚和丙烯酸合成了非离子聚合物增稠剂(EOAP),表征了EOAP的结构,并测试了其表面性能和应用性能,最后研究了EOAP对标准洗衣液和十二烷基苯磺酸钠(LAS)的增稠效果。结果表明,EOAP具有较高的表面活性,CMC为39.7 mg/L,γCMC为34.6 mN/m;与非离子表面活性剂AEO9相比,EOAP的应用性能没有明显减弱;在保证主表面活性剂的优良性能的前提下,在标准洗衣液和L
期刊
自税收产生以来,就伴随着税收不遵从的现象。很多学者都比较看重税收遵从,投入了很多的精力去进行研究,提出了传统税收遵从模型,其中最具有代表性的就是A-S模型,根据这个模型的结论,税收遵从会对稽查率、处罚力度这两个指标产生正向的影响,但是也不是所有的情况都适用这个结论,比如在一些国家,税务机关的稽查能力比较弱、对纳税不遵从的处罚比较轻,但是却表现出了比较高的税收遵从度。因此引发了人们对纳税遵从的内在动
学位