基于海量数据的社会网络链接预测分析

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:chinamax
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络中的一个节点可以代表一个物理实体,节点之间的连边代表某种相互作用关系。自然界和人类社会中存在的大量复杂系统都可以通过形形色色的网络加以描述。如果将社会网络中的人抽象为节点,人与人之间的关联抽象为节点之间的边,则一个典型的社会网络可以表示为一个社会图G=。链接预测通过分析社会网络拓扑结构,辅以社会网络中的节点性质,试图通过这些性质以当前时间点的社会网络预测给定时间点的社会网络中的指定链接是否会发生。链接预测方式近来的发展趋势是引入监督式学习的方法进行预测。我们可以将链接预测转化成分类问题,即首先获取当前网络的链接关系分布,然后根据这些链接关系提取特征集,将特征集输入到分类器中进行学习训练,训练后的分类器即可以对未知的链接关系进行预测。研究改善链接预测正反类偏态分布的抽样方法,寻找计算复杂低的算法以适用于海量数据对于运算效率的要求,设计反映社交网络动态特性的预测模型是近来链接预测三大热点发展方向。本文主要完成下面工作:1)海量数据带来的高复杂性已经成为社会网络分析中不可回避的问题,在链接预测领域,寻找新的高效快速相似度特征算法成为了解决上述问题的关键,本文提出邻居相似度度量,实验证明提高了预测准确率,并保持了较低的计算复杂度。2)现有的1:1抽样的方法虽然避免了复杂网络稀疏性导致的“淹没”问题,但是采用1:1抽样训练所得分类器实际预测性能不稳定,需要寻找新的抽样方法。本文提出1:3抽样。实验结果表明1:3抽样方法有效改善了1:1抽样中存在的欠训练问题。
其他文献
家蚕30K蛋白是家蚕5龄幼虫时期血淋巴中表达量最高的蛋白,是家蚕发育时期主要的能源物质,具有多种生物学功能。目前已经报道的家蚕30K蛋白共有5种,分别为BmLp-C6、BmLp-C12p、Bm
21世纪以来,经济迅猛发展,在人们的日常生活中,越来越倾向于购买绿色并且质量安全高标准的农产品。在我国,农产品冷链物流的超快发展受益于这一变化的推动。然而,和欧美等这些较发达国家相比较,我国农产品年损失率有25%-30%这么高,是欧美等国的4倍-5倍。因此,农产品冷链运输流程必须要得到大力优化,才能让农产品品质安全得到最大限度的保证,同时,达到损耗率较少且冷链物流成本降低的目标。这样,不仅能让冷链
自然界中微生物碳酸盐岩的沉积机制是沉积学领域研究的热点之一,碳酸盐形成机制从过去的物理化学成因一直发展到现在绝大多数研究者所倡导的微生物成因,取得了丰硕的成果,但是不同来源的镁对微生物岩形成的影响研究甚少。基于此,本实验分离纯化出一株表皮葡萄球菌Staphyloccus epidemidis Y2,测定了该菌的生长曲线、pH值曲线。为探讨其pH上升的原因,对该菌进行氨气定性实验及碳酸酐酶活性测定。
近几年来,相干控制光脉冲的传播引起了许多学者的注意,它对量子信息的可逆存储和高效加工具有重要的应用价值。而电磁感应透明(EIT)为实现量子网络操纵量子光脉冲的动态传播提供
波方程是偏微分方程理论的一个重要的研究内容,对它的研究必将促进偏微分方程理论和其他数学分支的进一步发展。本文利用凸性分析方法和能量函数方法,研究了两个非线性粘弹波
劣质重油作为占到世界石油总储量三分之二的油品资源,对其进行有效的加工和利用可以大幅度缓解当前的石油危机。利用超临界水热环境对劣质重油进行改质反应,探究油砂沥青超临界水热改质的最优条件。选取玉米芯作为改质体系的添加剂进行油砂沥青和玉米芯超临界水热共改质实验,验证二者共改质的效果、探究二者共裂解的协同作用。首先,对反应设备(管式反应器)进行改进。增设反应体系传动装置,加强反应器内物料的混合程度;增设反
本文处理的都是有限群。利用子群的(?)-超中心性及可补性研究有限群的结构和性质是群论研究的一个重要课题,本文利用子群(?)-超中心性给出了p(?)-可补的新概念.得到了一些群
轴承被广泛使用在各类机械设备中,主要用来支撑机械旋转体。圆柱滚子在轴承中主要起到传递载荷以及支撑的作用。滚子柱面的加工质量极大的影响了轴承的使用性能,为了提高滚子柱面加工精度,提升加工效率,一种双盘直槽研磨方法被提出。在该方法中,使用气缸推动滚子,推料过程中存在时间间隙,导致滚子运动不连续,且装置结构复杂,占用空间大,运行调试不方便。为了满足滚子连续进料的要求,弥补机械式推料方法的不足,研究一种可
随着社会的发展,越来越多的复杂系统和社交网站开始流行。复杂系统和社交网络可以被抽象地描述为复杂网络,如常见的朋友关系社会网络、科研合作网络、电影演员合作关系网络、
构成物质的最小微粒是什么?这是千百年来人类一直追寻的课题。近代以来,人类对基本粒子的认知也在不断变迁,从不可分的原子到发现组成原子核的质子、中子再到现在的夸克和轻子。