论文部分内容阅读
在线社交网络正在改变人们的生活,这些改变通过社交关系得以广泛传播,社交关系指的是社交网络上个体之间的联系。对社交关系构建的研究,有助于了解网络的产生和演化;对社交关系分析的研究,有助于理解社交纽带的不同属性并基于它们分析整个网络。本文从这两方面出发提出了4个研究问题,研究如何在用户间(新用户和老用户之间,新用户自身之间)构建社交关系,研究如何表征社交纽带并以此为基础研究社交纽带的方向性。本文的具体研究内容如下:1.面向关系构建的意见领袖组选取。为了选取向新用户推荐的老用户,本文用多维数据点建模社交网络中老用户的影响力,将老用户中的意见领袖组选取转化为组天际线问题,并提出了一个组天际线算法——最小支配搜索算法。该算法首先针对输入构建最小支配图,接下来基于此图用搜索的方式找出所有天际线组。实验验证了该算法对于意见领袖组选取问题的有效性和高效性。2.面向关系构建的双选用户匹配。为了在两组双向选择的新用户之间构建社交关系,本文提出了泛化双向相似匹配这一问题。针对该问题,本文一共提出了3种适用于不同场合的算法:朴素的嵌套循环算法、基于分治思想的子匹配集算法和基于归一化策略的映射-过滤-验证算法。实验结果表明3种算法都能有效解决双选用户的匹配问题。3.面向关系分析的网络边嵌入方法。为了统一表征社交纽带,使关于社交纽带不同属性(强弱性、符号性、方向性等)的研究可以基于统一的框架,本文开创性地提出了一个网络边嵌入方法——edge2vec。该方法旨在将给定的社交网络嵌入到低维空间,学习每条纽带的嵌入向量。edge2vec创造性地结合自动深度编码机和skip-gram模型,保证网络中边的拓扑相似性得到保持。实验验证了edge2vec学习到的嵌入向量可以作为表征手段,应用于对社交纽带的各种分析。4.研究面向关系分析的社交纽带方向性建模。为了分析不同类型(单向、双向、无向)社交纽带的方向性,本文提出了方向性函数,它将每条纽带都映射到具体数值。进而提出方向性函数的学习方法DeepDirect,它首先学习纽带的嵌入向量,再基于嵌入向量学习方向性函数。具体地,DeepDirect以保持拓扑相似性为基本目标,引入标签数据,并辅以方向性模式,完成嵌入向量的学习。实验结果表明DeepDirect学习到的方向性函数可以很好地应用于两个关于方向性的具体任务。