基于用户兴趣的转发预测方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:SOMNUS1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交媒体的发展,用户在网络中不再局限于信息获取者这一角色,更是成为信息的生产者和传播者。相比于门户网站和搜索引擎等,人们在获取信息时更倾向于使用社交媒体。社交媒体下的信息传播影响着人们的行为,包括注意力、信息获取、意见想法、态度情绪、消费行为等,而转发行为是推动社交媒体信息传播的一大动力。因此,对社交媒体中的转发行为进行分析和预测是热点研究方向之一,具有重要的理论研究意义和实际应用价值。社交媒体众多,从海量的用户生产内容中挖掘出用户关系、用户兴趣、社交网络结构、用户影响力等影响转发行为的因素并利用其进行转发预测是一大挑战。本文的主要工作是从具有噪声大、多模态、协同关联等特征的用户生产内容中提取用户属性、关系属性和内容属性等,利用数据挖掘和机器学习的方法,分析和建立用户实时兴趣动态预测模型,在获取用户实时兴趣的基础上进一步对社交媒体中的用户转发行为进行建模预测。本文的主要研究内容和创新点包括:(1)本文借鉴现有的用户意见影响和情绪传播机制等研究,针对用户及其关注用户之间的兴趣影响,提出基于交互与非交互数据的兴趣影响框架。分别利用LDA、BTM话题模型处理采集到的Twitter文本数据,得到对应的兴趣向量,结合遗忘机制对用户实时兴趣进行建模。实验证明本文提出的PNPUIM用户兴趣模型(participated and not participated data-based user interest model)相比于传统用户兴趣框架下的兴趣模型,能够更好地预测用户实时兴趣。(2)从采集到的Twitter数据集中,提取用户特征、内容特征和关系特征等特征群,对其进行相关性分析,从而选取重要特征。针对当前机器学习分类算法训练所得的全局参数无法满足具体用户的个性化预测,提出BP算法下的PMLP个性化多层感知机(Personalized Multi-Layer Perceptron),训练出能够个性化预测的个性化参数,实现对不同类型用户的个性化转发行为预测。(3)利用数据挖掘和机器学习中Random Forest,SVM,MLP等已有的分类算法和改进的个性化感知机PMLP进行多模型融合,实现泛化能力和预测准确率的提高。通过对采集到的Twitter数据集进行数据预处理,依据用户关系网络来构造转发行为和非转发行为的训练集和测试集,进而验证本文的转发行为预测方法的可行性和有效性。结果表明,PMLP的分类效果优于SVM和传统MLP,达到与随机森林Random Forest相近的分类效果,并在平均法结合策略下与其余三个模型融合,进一步提升转发行为的预测准确率。综上所述,本文以社交媒体的Twitter数据为对象,提取和构造用户属性、关系属性、内容属性等特征群,针对用户间兴趣影响,用PNPUIM对用户实时兴趣进行建模表达和预测。结合得到的用户实时兴趣和已有特征群,经相关性分析后进行特征抽取,采用PMLP对用户转发行为做出个性化预测,采取多模型融合方法得到最终的用户转发行为预测,对于社交媒体的信息传播和舆情分析等相关研究工作具有较为重要的实际价值。
其他文献
三一律在17世纪的文艺复兴时期以及古典主义时期是受广泛认可的创作规则,人们凭借着三一律法则,让戏剧更有效的呈现出其真实感和逼真性。浪漫主义时期随着创作者对于无垠内心的探索,三一律不再能满足更为复杂的叙事需求,人们开始对三一律展开批判,将其视作戏剧发展的阻碍,这种反对的声音一直延续至今。但一个无法否认的事实是三一律的叙事在现代作品中频频出现,而且具有一定的美学韵味。针对这种现象,我们以现代的目光进行
大规模分布式系统正在成为IT行业的核心组件,支持各种类型的日用软件,包括网上银行,电子商务和即时消息等。与传统的独立系统相比,大多数此类分布式系统全天候地运行,为全球数百万用户提供必要的服务。此类系统的任何非正常停机都可能导致重大的收入损失,同时随着网路攻击手段的不断更新,越来越多的危险威胁到了系统的正常运行,这突出了进行网络防御,保护系统可靠性的必要。异常检测是网络攻击防御中一个关键的环节,异常
超级电容器是介于传统电容器和电池之间的新型储能器件,具有高循环稳定、快速充放电、高功率密度等优点,正在电动汽车,航天航空,智能电网,太阳能能源系统等领域发挥越来越重要的作用。作为超级电容器的核心,电极材料的性能直接决定超级电容器的性能。本论文以木粉为碳源,制备超级电容器电极材料,研究不同制备条件对电极材料结构和性能的影响,并优化制备条件,从而得到性能良好的电极材料。具体研究内容如下:(1)以木粉为
长期以来,作为煤矿采煤设备和运输设备上重要组成部分的矿用圆环链,由于服役环境恶劣,一直采用具有高强韧性、耐磨耐腐蚀性的23MnNiCrM054钢(简称54钢)生产制作。然而,随着煤矿行业向着新型高效率产能优化的方向发展,对矿用圆环链的尺寸规格和性能要求越来越高,传统规格的54钢已逐渐不能满足使用要求且成本较高。因此,研制达到生产工艺性能和使用性能要求且经济合理的新型大规格矿用圆环链用钢具有重要的意
自从2004年党的十六届四中全会提出“社会变迁”以来,“社会变迁”已成为中国普通百姓、政府官员关注的一个时代话题。近年来,闽西苏区研究活动活跃,学术成果丰硕。但是,有关
随着技术的发展,恶意代码的产生越来越简单、各种变体越来越多,对信息安全造成了严重的危害。如何自动、快速、准确地识别恶意代码一直是各大反病毒厂商和研究人员的研究热点。传统的恶意代码分析手段在与机器学习算法结合的过程中,在解释性方面往往被忽视,这与网络安全务实严谨的要求不能适应。本文针对在恶意代码分析中如何让增强分析过程的解释性方面进行了研究,重点阐述了两种具有良好解释性的恶意代码分析方法并结合两种分
为了满足所修复的1580支承辊的焊层质量及技术要求,根据产品要求设计选用了焊丝焊剂,按照工艺参数制作焊层模板试样并做机械性能实验,先后委托燕山大学、哈尔滨国家焊接材料质量监督检验中心等专业机构对其进行硬度测试、金相组织分析以及各项拉伸、疲劳强度、冲击以及力学性能等实验。通过实验能够证明首钢长白公司选定焊丝焊剂按照设计工艺方案得到的焊层达到焊层要求的硬度、金相组织及各项力学性能参数,完全满足支承辊修
低维纳米材料与结构由于其独特的性质而在未来光电子学芯片中具有潜在的应用价值,因此对低维纳米材料与结构的物理化学特性的表征是一项十分重要的内容,利用超快激光与物质相互作用可以获得材料的非线性光学信息,对研究材料的非线性效应具有十分重要的意义。因此在本文中我们搭建了超快非线性光谱与成像系统来实现低维纳米材料与结构的非线性光学表征,研究工作的创新点如下:(1)基于可调谐激发光源,所构建的光学系统能对各种
本文研究一类非线性Kirchhoff型方程组的初边值问题uu-M(‖▽u‖2+‖▽v‖2)△u-β△ut+α(1+|u|2)pu=f1(x),vu-M(‖▽v‖2+‖▽v‖2)△v-β△vt+α(1+|v|2)pv=f2(x).首先在适当的假设下得到一些先验估计.此外,通过先验估计和应用Galer-Kin方法获得解的存在唯一性,构造有界吸收集及解半群的紧性获得了整体吸引子.在整体吸引子存在性的基础
H-矩阵是一类重要的矩阵,其在量子力学、控制论和生物工程中具有广泛应用.本学位论文研究H-矩阵的三类子类矩阵,即几何加权不可约α-矩阵、代数加权α-矩阵以及代数加权不可约α-矩阵,应用其非奇异性,得到新的矩阵特征值定位集,同时引入代数加权范数,研究矩阵伪谱定位问题,得到新的伪谱定位集,具体为:首先应用几何加权α—矩阵和不可约性引入几何加权不可约α-矩阵,证明了几何加权不可约α-矩阵为非奇异H-矩阵