微博垃圾信息过滤方法及其在UGC新闻认证中的应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:chenzy43111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术快速的发展,网络社交媒体已经成为了最活跃的社交平台,为数亿互联网用户提供良好的沟通渠道。以微博为代表的网络社交平台的快速发展,普通用户可以方便地、快捷地发布和传播各种信息,开始进入“人人都能掌握麦克风”的自媒体时代。微博凭借开放性平台、互联网终端、内容实时性及低门槛等特性,在广大网民中快速渗透,发展成了一个重要的社会化媒体,微博成为广大网民获取新闻时事、自我表达、人际交往、社会参与及社会分享的重要媒介之一,从而使得微博已经成为社会公共舆论平台之一。社交平台在加速信息公开的同时,也带来了虚假信息的泛滥。目前,这些普通用户制作的信息(UGC(User Generated Content))不仅成为媒体获取新闻线索的主要来源,而且在政府部门快速应对重大自然灾害、重大突发事件、重大群体性事件、社会热点问题过程中发挥着举足轻重的作用。由于普通用户的媒介素养参差不齐,造成微博新闻事件普遍存在着虚假、差错、欠准确等问题,导致公众人物和主流媒体成为很多网络谣言和虚假报道的推波助澜者,严重损害了他们的媒体公信力。同时也给政府部门应对突发事件时造成很多障碍和舆论压力。然而,当人们在社交网络进行分享、交流、互动的同时,垃圾信息也在不断的膨胀。由于微博发布门槛不高,以及相关的法律体系的不完善,致使垃圾信息及一些无意义的信息在微博平台上显现。在微博新闻媒体事件中也包含了大量的垃圾信息,直接影响了网民的实际体验与事件跟踪,也对谣言事件的辨别产生了影响。微博垃圾信息过滤是提高微博信息可用性的关键技术之一。当前迫切的需要一种技术来净化社交空间,营造一种健康的微博社交体系,所以,社交网络下的微博垃圾信息过滤技术已经成为普遍关注的热点问题之一。  本文面向微博领域进行识别过滤微博垃圾信息的研究,主要的研究工作及成果如下:  1)针对微博平台上的垃圾信息,通过详实的实验分析,提出了多个有效的垃圾信息过滤的特征。  2)采用朴素贝叶斯方法对微博垃圾信息进行过滤,实验证明该方法具有较好的过滤性能与时效性。  3)将微博垃圾信息过滤方法应用到微博UGC新闻认证系统中,使谣言事件的召回率和准确率得到提升。
其他文献
虚拟机技术将操作系统与硬件资源隔离开来,在很多方面极大的方便了人们对计算机软硬件资源的管理。虚拟机在线迁移技术,是基于虚拟机技术的典型应用,能够将操作系统实例透明地在
随着网络技术的发展,互联网上的信息呈指数快速增长。人们利用搜索引擎,例如baidu,google从海量的信息中查找所需。然而,当前的搜索引擎只是把互联网上的网页收集到本地数据库,并
微粒群算法是一种基于群体智能的随机优化算法。其思想来源于人工生命和演化计算理论。微粒群算法通过微粒追随自己找到的最好解和群体找到的最好解来完成优化。该算法由于容
土地档案管理是国家档案的重要组成部分。土地档案管理不仅是土地管理工作的一项重要内容和基础工作,也是全面、科学用好土地的重要保证。随着社会主义市场经济的不断发展,土地
汉字输入技术是中文信息处理领域中特有的一项基础性关键技术。虽然目前有一些不依赖键盘的汉字输入产品和不少基于汉字字形的输入法,但是毋庸置疑拼音输入法是互联网用户最常
学位
随着互联网的快速发展,人们对互联网的依赖性越来越大,网络安全问题也日益突出.网络信息的过滤是网络和信息安全的核心关键技术之一.随着网络带宽和流量的"超摩尔"增长、对检
互联网的普及和服务器应用的的发展,对服务器端文件系统的性能提出了更高的要求.传统的单机文件系统已经不能满足服务器端负载对于文件系统在数据读写带宽、元数据访问吞吐率
随着半导体工艺突飞猛进的发展,芯片设计的规模不断增长,设计的复杂度不断提高,芯片功能日趋强大,系统级芯片SoC(System-on-a-chip)已经成为现实.与此同时,验证的复杂性也在
工作流管理技术在近年来得到了广泛的重视并逐步成为研究的热点。在这一框架下,主要的研究方向包括了工作流的理论基础、实现技术和工作流技术的应用等。其中,工作流的理论基础
由于安全事件不断增多,安全评估方法和工具就显得愈发必要.该文首先探讨了目前可用的三类计算机系统安全评估方法,包括:基于安全准则的官主评估、弱点扫描技术和信息财产的风