论文部分内容阅读
在线社会关系建模是社会网络分析和很多其他社会计算研究的重要基础,例如社区发现、影响力分析和链接预测。在线社会关系建模应该从两个层面来描述一个关系:关系属性和关系语义。由于关系属性的表示和测量都更加方便,因此,研究者们对关系属性的研究比较多,然而关系语义对我们理解社会关系也是非常有帮助的。当前的研究在关系的语义建模方面主要集中在关系的正负极性分析和关系的特定类型分类,这并不足以有效的揭示出一个特定社会关系的特定语义。在当前的研究中,研究者们更多的是利用一些网络结构的信息来研究社会关系,然而网络结构具有静态、非主观、语义信息缺乏等缺点。在社会语言学理论中,研究者们往往认为互动语言内容与社会关系语义是高度相关的。在这个理论的启发下,我们提出用关系参与者之间的互动语言内容来语义化的建模社会关系。我们将互动语言特征和互动语言内容均与社会关系语义相关联,然后提出了用互动语言内容来建模关系的一般性语义和细节性语义的三种方式,分别是:基于互动语言特征的社会关系语义化建模、基于表示学习的社会关系语义化建模和基于主题的社会关系语义化建模。本论文选择了两个差异性很强的数据集来做实验,分别是英文的安然邮件数据集和中文的新浪微博数据集。实验结果表明,我们提出的方法可以有效的帮助我们区分、比较和理解社会关系的语义。