基于情感时间序列的微博热点主题检测

来源 :中国科学:信息科学 | 被引量 : 0次 | 上传用户:jayngu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展,微博在信息传播过程中扮演着非常重要的角色,正逐渐演变成一种新型线上交流新闻源.人们已经习惯于通过微博平台来了解他们身边的朋友或家人在做什么,关心这个世界正在发生什么.然而,由于微博平台蕴含着海量信息,很难以人工的方式在微博上快速检测当前实时发生的重大新闻或突发事件.因此,面向微博的热点主题检测成为当下的一个研究热点.然而,现有研究主要侧重于主题识别而忽略了用户对于实时性的要求,少数针对实时热点主题发现的方法主要基于关键词的统计分析,实时性和准确率都有待提高.根据我们的观察发现,微博平台汇集了成千上万的观点与意见,包括对社会事件的讨论、对产品的评价等,这些观点使得微博成为一个非常有价值的观点意见数据源.通过分析观点与情感的实时变化,我们可以更好地了解相关主题的变化趋势,从而辅助用户判定其是否是流行的热点主题.本文结合微博的情感时序变化提出了一种实时的非参数化的热点主题检测方法.该方法通过对微博情感极性分析及其强度变化来计算情感时序分布,并利用上述特征构建一个复合模型以识别、检测微博热点主题.实验分别在Twitter和新浪微博等真实数据集上进行,结果表明我们提出的方法能够在保证检测准确率的前提下更快地识别热点话题. With the rapid development of the Internet, microblogging plays a very important role in the process of information dissemination and is gradually evolving into a new type of online news source. People are accustomed to understanding their friends or family through the Weibo platform What to do and what is happening in the world.However, due to the huge amount of information contained in the Weibo platform, it is hard to manually detect the most important news or incidents happening in real time on the Weibo. Therefore, the hotspot for Weibo However, the existing researches mainly focus on topic recognition and neglect the user’s requirements for real-time performance. A few methods based on the real-time hot topic discovery are mainly based on statistical analysis of key words, real-time and accuracy Have to be improved.According to our observation found that the Weibo platform brings together tens of thousands of views and opinions, including the discussion of social events, product evaluation, these views make the microblogging becomes a very valuable opinion Data sources. By analyzing the real-time changes in perspectives and emotions, we can better understand the changes in related topics Trend, so as to assist the user to determine whether it is a popular hot topic.This paper presents a real-time non-parametric hot topic detection method based on the emotional timing changes of Weibo.This method analyzes the emotional polarity of Weibo and its intensity Changes to calculate the emotional timing distribution, and use the above characteristics to build a composite model to identify and detect hot topics microblogging experiments were carried out on Twitter and Sina microblogging and other real data sets, the results show that our proposed method can ensure that the detection accuracy Rate faster recognition of hot topics under the premise.
其他文献
《书目答问》是一部在中国近代文化史上具有广泛影响的目录图书。它是晚清著名政治家、洋务运动的代表人物之一张之洞为了解决“读书不知要领,劳而无功;知某书宜读而不得精校精
研究激素和生长因子对体外无血清培养3T3和C3H10T1/2成纤维细胞增殖的调控作用。发现加胰岛素、胰高血糖素、表皮生长因子(EGF)和成纤维细胞生长因子(FGF)各组细胞数均明显高于单纯无血清对照组,且加激素各组3H-TdR掺入值均高出对照组3~6倍(P<0.05),其中EGF+FGF以及上述四种激素混合使用,二组细胞3H-TdR掺入值超出对照组30倍以上。
计算机技术给越来越多的人带来了方便和快捷,在生活和工作当中离不开它发挥出来的作用,计算机技术促进我国“互联网+”的实现,真正实现了当今信息化时代的梦想。如今在学生计
用物理化学方法纯化的人血浆蛋白C(HPC)免疫小鼠,制备了8株分泌抗HPC单克隆抗体的杂交瘤细胞株,分别命名为PC01~PC08。各株杂交瘤细胞都具有长期稳定的抗体分泌能力,其中PC03
85年底、86年初,我正在翻译一本关于现象学文学理论和文学批评的专著,其中有两章是关于海德格尔文学理论、批评理论和意义理论的.为了译文能做到“信”,我打算读一些参考资料
AIM: To investigate the relationship between the staging by endoscopic ultrasonography (EUS) and the expression of carcinoma metastasis associated gene in the p
首先,作为一名求职者,应有得体、整洁的着装,并且搭配得体。记得有一次面试,一位年轻的小伙子虽穿了一身较休闲的服饰,但搭配得非常得体,给所有考官留下了很深的印象。但这种
世界著名传播学家麦克卢汉在他的经典著作《大众传播媒介——人体的延伸》一书中提到:文学是视觉的延长,笔是手的延长,书是眼睛的延长,无线电通讯是耳朵的延长……大众传媒彻底改
饮食与人类的关系至为密切,深入、全面地研究内涵丰富的中华传统饮食礼俗,无论是对深化研究中国社会生活史,还是对拓展中国传统文化研究的领域,都是一件十分有价值的事情。