基于时间序列的网络热点话题模式分析

被引量 : 3次 | 上传用户:yudsly2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
热点话题不仅对虚拟网络中各种事件的形成和发展有极大影响,还影响了真实人类社会中的人们对待事件的看法和判断,甚至于影响了司法机构和政府对事件的判决。揭示和预测热点话题的传播模式成了非常重要的问题。本文以热点话题的热度时间序列为出发点,完成聚类、建模和预测热点话题传播模式的目标。本文的研究工作主要体现在以下两个方面:第一,对热点话题的发展模式进行聚类。对热点话题的热度时间序列进行聚类是揭示和建模网络上热点话题形成和发展的重要过程。目前较好的K_SC聚类算法具有高时间复杂度、对初始类矩阵中心高度敏感的特性,使其难以在实际高维大数据中应用。本文提出一个新的迭代式聚类算法WKSC,主要提出两点创新:(1)采用Haar小波变换压缩原始时间序列,降低原始时间序列的维度,从而降低了算法的时间复杂度;(2)在Haar反小波变换中,将低维聚类返回得到的矩阵中心作为高维聚类的初始聚类中心,在迭代聚类过程中优化了对初始矩阵中心高敏感性的问题,提高了聚类的效果。文中采用国内外3个数据集作为实验样本,进行了大量的对比实验,结果显示WKSC算法能显著降低聚类的时间复杂度,同时改进聚类效果,可很好的应用于大量高维热点话题的模式分析。第二,建模和预测热点话题传播模式。对热点话题的传播模式进行建模和预测是一个非常重要但是困难的问题。本课题针对参与话题讨论的用户特点进行了分析,构建了用户知名度、活跃度以及用户重入概率等合理假设条件,基于用户参与话题的概率提出了单峰和多峰两个模型。采用国内外2个数据集对所提模型进行了拟合、预测实验,结果表明所提模型在拟合和预测话题发展趋势上都有较好效果,尤其是针对复杂波动发展模式的话题,本课题所提模型能很好的拟合与预测话题的波动。本课题的研究内容有助于网络话题检测、国家舆情监控以及促进电子商务的健康发展。
其他文献
随着市场经济的不断发展企业面临着更加复杂多变的经济环境,为了能在变幻莫测的国内外市场中站稳脚跟更多企业已经向着跨行业、跨地区、跨所有制的企业集团模式迈进,企业集团如
随着我国市场经济的迅猛发展,企业间的竞争日趋激烈,税收筹划在经济管理活动中的地位显得尤为重要。本文以企业集团为研究对象,介绍企业集团在生命周期理论指导下的税收筹划
进行睡眠时呼吸检测对预防睡眠呼吸暂停综合症以及监测人体睡眠时的生命特征有着积极的意义。接触式的检测方法对人体的束缚性大,长时间的接触式呼吸检测会影响人的睡眠。针对
研究发现,金属纳米粒子及其聚合物具有异常光学透射性能,并且其透射光谱受结构的形状、对称性、材料及入射光偏振态等因素的影响。因此,可以通过不同形状及尺寸金属纳米粒子的组
以港口铁矿石火车装车系统的应用为课题依据,研究铁矿石取装过程中出现的主要问题,通过对实际问题的分析总结,对装车系统的部分设备进行了优化设计改造,从而增强装车系统的稳定性
在幼儿园集体教学中,教师用于管理的时间越多,则用于教学的时间就越少,从而会大大降低教学效率,不利于教学活动的有效开展。在幼儿园集体教学中应该如何进行有效的管理,是教
目的探讨超声引导在肌肉及骨骼疾病治疗中的应用价值.方法对162例肌肉骨骼疾病患者在超声引导下进行治疗,分析其临床价值.结果162例肌肉及骨骼疾病患者随访均未出现出血、感
伴随着我国电视剧产业的日渐成熟,越来越多的题材、风格、类型的电视剧在荧屏上相继呈现。在这些题材中,现实题材电视剧表现最为活跃,几乎占据了电视剧市场的半壁江山,一批优秀现
我国自1980年开始实行独生子女政策以来已经过去了三十多个年头,我国的人口形势已经发生了非常大的改变,并且随着国家的发展,各种社会现象也层出不穷,特别是近些年大家十分关注的
贾平凹长篇小说创作从题材、主题到叙事手法有一个发展的过程。文章通过探讨贾平凹最新长篇《山本》的叙事艺术,揭示了贾平凹民间立场的历史叙事的最新特色,并把贾平凹的这种