基于情感词典与句型分类的中文微博情感分析研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:dljx1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络的快速发展使得人们获取信息的方式发生了巨大的变化,越来越多的人开始习惯于通过网络来获取自己感兴趣的新闻资讯、热点信息等。其中,微博作为一种被普遍应用的网络媒体,以其丰富多彩的传播内容,随时随地的沟通手段受到了广大网民的青睐。庞大的微博用户量使得其数据量也呈现指数级增长,这些数据量中包含有大量的情感信息,对这些数据进行情感倾向性分析,不仅可以了解微博用户对重大事件、企业产品的情感态度,还可以为市场产品调研、网络舆情预警,以及政府制定决策提供有力的依据,具有巨大的社会和商业价值。现有的微博情感分析研究大多是针对于英文微博的,对中文微博的情感分析还处于起步阶段。本文针对中文微博的特点,进行了以下研究工作:1.中文微博情感分析相关概述。分析了中文微博的主要特点,对前人的微博情感分析方法理论进行分析与总结,比较基于情感词典的情感分析方法和基于机器学习的情感分析方法,针对两种方法的不足,提出一种新的基于情感词典与句型分类的中文微博情感分析方法。2.中文微博情感词典构建。以现有情感资源为基础,对情感词典进行网络化扩展,构建中文微博情感词典,详细介绍了基础情感词典、网络情感词典、表情符号库的构建方法,并在此基础上,利用拉普拉斯平滑的SO-PMI算法对微博情感词典进行扩展。3.基于句型分类的微博情感倾向性分析。深入分析不同句型对句子情感倾向性的影响,通过改进C4.5决策树分类算法进行句型分类,并在此基础上,对不同句型进行相应分析处理,计算句子情感值,并同时考虑标点符号,关联词、句子位置等对句子情感强度的影响,对句子情感权重进行调整,分析微博情感倾向性。基于以上研究,利用COAE2014中任务四中公开的标准微博数据集作为测试语料,设计实验对本文方法的可行性进行验证。实验结果显示,该方法能够有效的对中文微博情感倾向性进行判别,具有较高的准确率。
其他文献
智能电网是建立在集成的、高速双向通信网络的基础上,通过先进的传感和测量技术、设备技术、控制方法以及决策支持系统的应用,实现电网的可靠、安全、经济、高效、环境友好和
随着科学技术特别是无线网络技术的飞速发展,人们的通信方式也发生着日新月异的变化。当代,移动网络通信已经渗入到人们工作生活中的每一个角落,人们已经无法脱离移动网络而
随着计算机的普及以及互联网的迅猛发展,大量信息以电子文本的形式出现在人们面前。为了应对信息爆炸带来的挑战,迫切需要一些自动化的工具帮助人们从海量信息源中迅速找到真
动态目标跟踪技术是计算机视觉研究领域中最重要的研究课题之一,在视觉导航、军事制导、交通监测、医疗诊断等方面都有着广泛的应用。粒子滤波技术是目标跟踪领域的核心算法,
在分布式系统中,所有的资源都是服务,服务具有低耦合性、易用性、复用性和可组合的特点。传统的服务发现通常是以服务的功能性描述信息作为关键值进行服务发现,往往忽略了服
关联规则挖掘作为数据挖掘的一个重要研究领域,通过各事务项集之间的相关联系,给用户提供感兴趣的规则,在商业、科学和其它应用方面得到了广泛应用。但是,传统的关联规则挖掘
在移动计算环境中,数据一致性是移动数据库在实际应用中必须解决的主要问题之一,而同步复制技术是维持数据一致性的关键技术。然而,现有的同步复制方案存在一定的局限性:日志
软硬件划分是软硬件协同设计中的关键技术。软硬件划分是指在系统设计时,确定各个功能模块是采取软件还是硬件的实现方式。软件实现的特点是灵活、成本低;而硬件实现的特点是
人类进入二十一世纪以来,随着科学技术的发展,网络信息技术也得到了飞速发展。与此同时,网络中各种各样的安全隐患也层出不穷。尤其是近几年来,由于拒绝服务攻击易于实施,破
文本倾向分析目的是确定文本所表达的态度或观点,近几年来已经成为信息检索和自然语言处理领域的一个热点问题。文本倾向分析分为两个方面:情感(emotion)和情感倾向(sentimen