基于位置社交网络的朋友关系预测研究

来源 :太原理工大学 | 被引量 : 7次 | 上传用户:xuzhoucumt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的普及以及移动智能设备的发展,基于位置的社会网络(Location-Based Social Network,LBSN)逐渐进入人们的生活。LBSN通过将用户移动行为和地理位置信息关联,充分挖掘用户潜在行为与其日常活动位置的相关性,使线上虚拟世界和线下现实生活之间建立密切联系,为社会关系预测等领域开辟新的研究方向。LBSN中的签到数据包含用户时间、空间等多重信息,为朋友关系预测提供了可能。但是,LBSN网络结构比较稀疏,难以完整反映个体签到行为。因此,从现有的数据中挖掘用户完整信息,并利用隐含知识刻画用户特征,成为用户行为研究的重要方向。为了实现上述目标,本文提出基于支持向量机(Support Vector Machine,SVM)的朋友关系预测框架,并利用Gowalla和Brightkite两个数据集进行仿真实验,结果表明该方法的有效性和可行性。具体来说,本文主要研究工作包括以下四个方面:1.分析Gowalla和Brightkite数据集中用户行为特征,如用户好友数、签到地点以及签到次数,发现其均呈长尾分布,并且两个网络中拥有好友数超过50个的用户占极小比例。在Brightkite中签到次数小于10的达到43.5%,进一步说明数据的稀疏性,给好友预测带来新的挑战。2.利用用户签到时空信息,分析用户移动区域以及移动周期,进而挖掘用户移动规律。分析移动区域时,发现绝大部分用户只在较小的范围内活动。相对而言,Gowalla数据集中的用户活动半径较大。对移动周期的分析得知,用户活动呈现出一定的周期性,与人们的生活规律相契合。3.在上述网络结构以及用户移动行为分析的基础上进行特征提取。根据传统基于节点相似性的度量方法,提出本文用户社交关系计算方法,并提取用户签到距离以及签到类型作为朋友关系预测的输入特征。4.建立基于SVM的朋友关系预测框架,融合上述特征分别对朋友关系进行分类预测,并用准确率、召回率、F1-measure以及AUC值进行评估,发现社交关系对朋友预测的影响最大,三个特征融合的预测准确率优于单个特征。为了进一步改善预测效果,利用遗传算法(Genetic Algorithm,GA)、粒子群算法(Particle Swarm Optimization,PSO)以及网格搜索(Grid Search,GS)对惩罚因子C和核参数g进行优化。
其他文献
伴随着移动通信与计算技术的结合发展,移动终端拥有了更广泛的用途,移动终端被人们使用来处理和存储各种数据比如名片、日程安排、邮件乃至文档、目录等各种结构化或非结构化
随着科学的发展和时代的进步,人们在工业生产和工程实践过程中遇到的问题,越来越多地具有规模大、复杂性、约束性、非线性、不确定性等特点,在生产实践和科学研究的诸多领域
牛乳体细胞的自动识别,对提高牛乳质量检测和奶牛乳腺炎诊断的效率和准确性具有重要意义。而牛乳体细胞中存在的细胞堆积现象,严重影响了其他特征参数的分析。目前,存在的大
随着计算机网络的快速发展,网络安全问题日益突出。依靠传统的数据加密、防火墙、安全认证、反病毒等安全技术,不足以抵抗现代的入侵与维护系统的安全。近年来入侵检测(Intru
在建设和谐社会的今天,对社会稳定提出了更高的要求,而传统的报警和求救方式缺乏实时性和隐蔽性,信息量也是有限,所以建设一种有效、信息量丰富的综合报警系统成为了当务之急
算法演示作为软件可视化的一个重要分支,在计算机算法教学和研究中扮演着重要角色,而算法演示中的人机交互对提高算法演示的积极效果有着非常重要的作用。近年相关研究指出,算法
信息检测技术是目前信息学科的前沿研究课题之一,在生产发展上起重要作用。尽管各种信息检测技术在不断地发展,一定程度上解决了检测领域上存在的问题,但对于怎样检测无法检
算法和建模是软件开发中两个最为重要的部分,算法设计以及实例建模的优劣直接影响着软件工程的质量,因此设计合理的算法并建立正确的模型是提高软件质量的关键。本文首先介绍
文本复制检测就是判断一篇给定文档是否抄袭﹑剽窃了或者复制于另外一篇或者多篇文档的内容,复制不仅仅是原封不动地照搬,还包括部分复制、对原作的移位变换﹑同义词替换以及改变
随着通信技术的发展和社会需求的不断变化,各行各业都架设了自己的网站,对外提供各种Web服务。网络的普及和应用对计算机的能力提出了更高的要求,但传统高性能的计算机在性能