论文部分内容阅读
近年来,随着在线社交网络平台的兴起,大量用户通过互加好友或相互关注等方式,在平台中建立起社交关系,形成了具有大规模结点的在线社会网络。在线社会网络数据中蕴涵了丰富有价值的知识,同时查询与挖掘该类数据具有较大的挑战性,从而产生社区发现、影响力分析、基于社会网络的团队形成等研究方向。基于社会网络的团队形成问题是找出一个能够满足给定任务需求且关系紧密的一组专家。现有的社会网络中团队形成问题均强调专家间的关系紧密性,这种紧密性可降低成员间的沟通代价,有利于任务的顺利完成。然而,实际应用中存在大量要求团队成员间具有不紧密关系的需求,这种成员间的不紧密关系使得团队的观点多样化、多角度、无偏见。基于此需求,本文将社会学的弱关系概念引入团队形成问题,提出一种社会网络中弱关系团队形成问题,该问题旨在寻找成员间为弱关系,同时满足技能、经验值要求的一个团队。例如,在项目评审中,如果评审专家整体具有高经验值的同时,相互间具有弱关系,可以使得评审结果无偏见性;另外,交易纠纷解决与电视节目评选广泛采用大众评审团机制,如网络购物平台“淘宝网”采用大众评审来解决一些买卖双方的问题,若评审团中成员间具有弱关系则有利于避免评判结果的趋同性,从而保证评判结果的公平性。在传播效率方面,如社交平台上的广告投放,将有限的资源投放在高影响力弱关系的结点上,可以避免信息在关系紧密结点上的局部传播,使得信息传播更加广泛,从而有效提升广告投放效果。本文使用网络中结点间的跳数或边权值度量弱关系,同时证明了该查询问题为NP难问题,并提出三类算法来解决该问题,分别为贪心算法、精确算法、α-近似算法,每类算法有各自的特点与适用范围。其中,在贪心算法下提出两种贪心策略,分别为基于结点分数的贪心策略和基于结点分数与图结构的贪心策略,贪心算法具有较高的搜索效率,适用于大规模数据集,但求解质量难以保证;精确算法分别采用回溯法与动态规划方法实现,适用于问题规模较小时的应用情况;α-近似算法在动态规划精确算法基础上,保留可以保证近似率的候选解,具有较高的查询效率同时可以保证一定的近似率。本文采用ACM和DBLP两类真实的数据集进行实验,综合评估了各类算法的效率与求解质量。实验表明,在精确算法中,基于动态规划算法的求解效率远优于回溯法,而基于动态规划的近似算法也有较高的运行效率。另外,本文还对查询结果的质量和团队影响力进行分析。实验表明,基于结点分数与图结构的贪心策略所求解质量要优于仅基于结点分数的贪心策略,而近似算法又优于前者。同时,本文采用影响力最大化的传播模型以及团队所占社区数对团队的影响力进行实验分析,验证了本文所提出的弱关系团队较强关系团队具有更大的影响力。