多属性随机游走在社会网络中的应用

来源 :西南大学 | 被引量 : 0次 | 上传用户:dalianwaiguoyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web 2.0技术的飞速发展,互联网活动已经成为人们生活密不可分的一部分,人们对社交网络也愈发依赖,这意味着互联网信息时代的迅猛发展。同时在各种移动智能终端技术的推进下,社交网络上的各种各样的信息数据成爆炸性增长,如何从海量的数据中精确挑选出对用户有价值的信息就具有了重要的理论价值和现实意义。在此形势下,人们往往需要从海量数据中挖掘出已有信息来预测未来的信息及其发展趋势来满足对信息的需求,以此为背景,链接预测方法应运而生并逐步推广开来。推荐系统就是以链接预测方法为基础建立起来的,在实际社会网络中的一种典型应用。在推荐系统中,传统的算法大多是根据节点的相似性进行推荐,然而在实际社会网络中,节点的大部分信息通常是隐藏的,因此导致传统的推荐算法难以社会网络中的推荐需求。所以,如何充分地利用社会网络中的各种已知信息来提高用户推荐的精确度,已经成为一个非常重要且有价值的研究问题。本文通过学习社会网络相关理论,对应用于社会网络推荐与链路预测的多种算法进行了分析。发现随机游走算法具有逻辑简洁、易于实现等优点,因而在各种社会网络中已得到了广泛的应用,且在链接预测和推荐系统中更是得到众多研究者的青睐。因此,本文进一步结合了实际社会网络的特性,对传统的随机游走进行了针对性的改进。首先,将拓扑结构的相关属性加入随机游走模型中,发现改进后的随机游走模型在链接预测中展现出了明显的性能提升,从而进一步把随机游走算法推广到推荐系统中。接着,考虑到实际社会网络中的用户往往包含多种对推荐系统存在直接影响的隐藏属性,本文将多种隐藏属性融入到随机游走算法中以提高推荐的精准度。另一方面,考虑到社会网络中的诸多隐藏属性潜在于文本信息中,本文引入了能充分挖掘文本潜在信息的Latent Dirichlet Allocation(LDA)主题模型来辅助节点隐藏属性的挖掘。LDA将首先对社会网络中的节点进行主题划分,并将得到的主题标记节点的隐藏属性,这些隐藏属性作为辅助信息来进一步完善推荐系统,从而更好地提高推荐系统的性能。针对随机游走模型在链接预测上的应用,本文首先分析并讨论了各种链接预测算法,并将拓扑结构属性融入到随机游走算法中,提出了CN-LRW算法和CN-RWR算法。基于提出的两种算法,本文三个常用数据集上进行了多种算法的对比实验,以此来分析各种算法的优势与劣质。对比结果显示,本文提出的基于随机游走的CN-LRW算法和CN-RWR算法在链接预测中均提供了较其他方法更为准确的预测结果。因而证明了在随机游走算法的基础上,通过融合社会网络节点的隐含信息能够有效地提高链接预测的准确性。针对随机游走模型在推荐系统上的应用,本文构建了可以反映社会网络中用户-用户以及用户-项目之间关系的User-Item(UI)二部图,随后利用LDA来挖掘出项目和项目之间的潜在联系,然后在整个异质网络上通过MA-RWR算法来对用户进行项目推荐。通过在Cite ULike数据集和last.fm数据集上的实验结果表明,融入多种关系之后的MA-RWR算法能有效地提高推荐系统的性能,体现出用户的兴趣偏好在一定程度上受到社会关系的影响,而且实验中融入的项目的属性信息对算法也起到了很好的促进作用。此外,本文还基于数据子集分析了不同的网络结构对算法的影响。另外,考虑到随机游走的计算复杂度较高,本文通过计算复杂度相对较低的吸收随机游走算法,并在吸收随机游走算法中加入拓扑结构属性和隐藏属性,从而分析和讨论各种隐藏联系对推荐系统的影响。实验结果表明,本文中基于吸收随机游走提出的TB-ARW和LA-ARW算法能够很好的应用到推荐系统中提供可靠的推荐结果。
其他文献
文章将传统的大坝安全评价方法与模糊数学相结合,以摆脱传统方法中的主观因素,提高安全评价的可靠性。并将该方法归结运用到应用程序中,为安全评价提供一个便捷准确的途径,使
泛美卫生组织提出的PAHO-Hanlon方法通过对国家卫生合作战略的各领域进行排序,得出卫生合作领域的优先顺序,可类比用于国际卫生合作需求的研究。本文对该方法进行了适用性分
目的:分析《世界医院管理调查表扩展版(D-WMS-H)》在我国公立医院开展应用的适用性,初步测量医院内部管理水平。方法:翻译、修订D-WMS-H调查表形成《中国医院管理调查表-扩展
目的:探讨主动性量化腹部按摩预防骨折卧床患者便秘的方法。方法:以Orem自理理论为指导评估患者的自理能力,选择下肢骨折卧床并能自行完成腹部按摩的具有部分自理能力的住院
深圳市以“共建共享、全民健康”为战略主题,加强专业公共卫生机构、公立医院、基层医疗卫生机构“三位一体”的公共卫生服务体系建设,持续完善公共卫生政策法规体系,健全财
目的:分析公立医院内部管理水平对公立医院技术效率的影响。方法:在应用《中国医院管理调查表—扩展版》(D-CHMS)工具测量63家公立医院管理水平和应用Bootstrap-DEA方法测量
目的探讨宫内节育器联合迪康防粘连膜在中重度宫腔粘连术中的效果。方法选择2015年3月-2017年3月厦门市妇幼保健院接诊的90例中重度宫腔粘连患者为研究对象,按照入院治疗的先
无损检测技术是一种在不破坏受检对象的前提下测定、评价物体内部或表层物理和机械性能及各类缺陷和其它技术参数的综合性检测技术。其应用范围随着科学与生产的发展日趋广泛
目的:在临床前研究中,建立蒜氨酸原料药的质量控制方法。方法:采用薄层色谱法对原料药中的蒜氨酸进行定性鉴别;采用高效液相色谱法,Agilent ZORBAX SB-C18色谱柱(4.6mm×250m