基于多维属性的社会网络信息传播模型研究

被引量 : 8次 | 上传用户:iamup
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着社会化媒体平台的迅速发展,如:Facebook、Twitter、Youtube、WhatApp、微博、微信等,社会化媒体分析已经成为一个非常热门的研究领域。社会网络信息传播是社会化媒体数据中最重要和最普遍的特征之一,研究信息在社会网络中的传播情况以及影响因素已经成为社会化媒体分析领域的重要课题之一,并受到研究人员的广泛关注和研究。研究社会媒体中的信息传播分析模型及模式,对分析社会网络中的社会节点属性特征、理解社会网络结构、社会网络信息流向、分析和预测信息传播的广度和深度等具有非常重要的理论意义。同时,研究社会网络信息传播也具有非常广泛的应用价值,目前正逐步应用在舆情监控与分析、谣言追踪、企业营销、个性化精准营销等众多领域。本文旨在研究社会化媒体中的基于网络属性的信息传播模型。在数据准备方面,本文研发出一种并行、高效的数据获取系统。通过考虑社会网络中的静态属性(包括网络属性、非网络属性)和动态属性,本文提出一种位置信息与社区结构的关联分析方法,给出四种轨迹模式的定义及抽取算法,并在此基础上提出了基于位置信息和社区结构信息社会网络信息传播模型;针对用户的网络结构属性和非网络结构属性,提出了一种多层的信息网络融合方法(MLN),给出一种基于MLN的信息传播模型;针对用户属性的动态性,提出一种基于N-Pat-Tree结构的新词发现方法,给出一种社会网络的动态属性融合方法,并在此基础上提出一种新的信息传播模型及验证方法。总体而言,本论文主要的研究成果和创新之处主要体现在以下几个方面:(1)大规模社会化媒体数据获取和定向分析数据获取是开展社会媒体数据分析与挖掘的基础。与传统的数据相比,社会化媒体数据具有如下几个特点:数据体量大、数据结构复杂、数据内容丰富、数据获取方式灵活等。本文基于社会化媒体平台的特点,研发并行、实时的社会化媒体数据获取系统,并在此基础上,对社会网络节点的属性特征和规律进行了定向分析。本部分的具体工作主要体现在:分析了社会网络节点的空间行为,提出了节点的主要活动位置这一定义;基于节点的社区结构信息,分析了用户的空间位置聚类与用户网络社区之间的关联程度,提出了信息熵这一概念,用于描述空间聚类下用户关系的混乱程度和同一社区下用户位置的分布情况等;统计分析了大规模社会化媒体数据中的节点的空间运动轨迹,提出了四种社会网络节点的轨迹行为模式,并在城市间紧密程度及热门城市发现方面做了实证研究。本部分的工作为后续的信息传播研究提供良好的数据基础和理论基础。(2)基于位置信息和社区结构信息的社会网络信息传播分析当前对社会网络信息传播的研究侧重于网络结构对信息传播的影响,忽略了节点的属性以及节点自身所处的环境对信息传播的影响。针对这一问题,本文基于社会化媒体数据中的网络节点分析结果,提出了基于位置信息和社区结构信息社会网络信息传播模型。具体工作体现在:引入社会网络节点的位置信息和社区结构信息,针对不同的节点属性给出不同的传播参数,保证了信息的差异化传播;通过引入位置信息,保证事发地节点对信息传播的可信性,有利于对事件的传播范围进行定性分析;引入社区结构信息,增强了节点之间进行信息传播的可信性,有利于对事件的传播范围进行定量分析。因此,本部分提出的基于位置信息和社区结构信息的信息传播模型,有助于对事件传播进行定性和定量分析,对重大事件的监控和应急处理具有非常重要的应用价值。(3)多层的静态信息网络融合方法和信息传播模型在社会化媒体平台上,用户往往会发表自己感兴趣的信息,结交朋友,浏览和评论朋友的信息等,因此,社会媒体中的用户都具有网络属性(朋友关系)和非网络属性(个体行为),如何充分利用上述两类信息来研究信息传播模型,具有很重要的意义。本文将用户自身所具有网络结构属性和非网络结构属性按层进行融合,提出了一种多层的信息网络融合方法(MLN),其中每一层表示个体间不同类型的关系或属性。在此基础上,我们提出一种基于MLN的信息传播模型,并在四种真实的微博数据集上进行了实验验证。实验结果表明,多层网络融合方法和提出的基于MLN的信息传播模型在发现活跃用户方面具有更好的准确性。(4)基于动态属性的社会网络节点相似度计算方法和信息传播模型社会化媒体中的用户属性(包括网络属性和非网络属性),往往会受到用户当前行为的影响并随着时间动态变化。为了研究上述动态属性及其信息传播模型,本文对用户当前发表和转播的信息内容、关注的话题和标注的标签等关键词进行提取,并通过相似度矩阵计算网络节点间的相似度,提出一种社会网络的动态属性融合方法,并在此基础上给出新的信息传播模型及验证方法。在关键词提取过程中,我们发现社会化媒体正在产生越来越多的网络新词,这为关键词的提取及用户行为的分析提出了挑战。为解决这一问题,本文提出一种基于N-Pat-Tree结构的新词发现方法,给出一些新的过滤机制,提出一种多维度发现及分析网络新词的算法,并将该算法应用在真实的微博数据中,证明了上述算法的有效性,同时发现很多有意义的结果。
其他文献
21世纪以来,我国高等教育规模迅速扩张,逐步实现了由“精英教育”向“大众化教育”的转变。随着“大众化教育”时代的来临,当代大学生的考风败坏现象层出不穷,考风作弊问题屡禁不
论述在初中生物学实验教学中,教师如何针对实验教学中经常出现的各种错误,采取不同的纠错方法,帮助学生学会分析错误的原因,通过综合使用实验纠错法、观察纠错法、示范纠错法、比
永磁同步电机具有结构简单、体积小、效率高和运行可靠等诸多优点在数控机床、航空航天和机器人研究等领域得到了广泛应用。然而永磁同步电机是一个强耦合、多变量、非线性的
在专业工程领域,机械设备经常采用永磁同步电机作为驱动源以提供动力,永磁同步电机的性能则将直接影响到这些装置的驱动稳定性。而由于专业设备使用环境的复杂性和特殊性,对于电
随着社会的发展,教育在社会中的作用也越来越明显,教育基本已经成为我们每个人生活中的一部分。教育的每个阶段都需要得到重视,我国的高等教育在不断发展的同时,需要对其发展的不
在2003之后,房地产业已经发展为涉及土地、建设、交易和金融服务等多部门的重要产业,与此同时房地产市场的波动对国民经济的影响也越来越显著。政府为了防止房地产市场波动对宏
随着广告行业的不断发展和壮大,广告收入也逐渐成为很多公司的主要经济来源。为了更好的优化广告投放效果从而获得更大的利益,弥补传统广告的一些不足,在线广告行业迅速兴起,采用
<正>1月17日,山崎马扎克机床(辽宁)有限公司钣金新工厂在大连金普新区竣工投产,完全国产化的首台光纤激光机下线并投入生产,为大连高端数控机床产业发展注入了新的动力。成立
期刊
在永磁交流伺服系统中,一般采用位置环、速度环、电流环的三环级联控制结构进行控制。最内环电流环的性能直接决定了交流伺服系统的暂态和稳态响应,是提高交流伺服系统控制性能
随着油田开发程度的不断提高,对地层对比的精细要求也越来越高,本文通过深化储层再认识,精细单砂体刻画,开展单砂体级的"注-驱-采"认识,并取得了较好的应用效果,拓宽了油田挖