细粒度文本情感分析

来源 :河南科技大学 | 被引量 : 0次 | 上传用户：tdj_zhj

【摘要】

：

随着互联网的不断发展与普及，各种形式多样、功能不同的网站与应用层出不穷，例如具有社交、购物、学习等等功能的网站。这些网站中一般包含着用户对新闻事件、电影音乐、商品优

【作者】

：

常国沁

【机构】

：

河南科技大学

【出处】

：

河南科技大学

【发表日期】

：

2018年期

【关键词】

：

文本情感分析情感信息分类特征选择权重计算机器学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的不断发展与普及，各种形式多样、功能不同的网站与应用层出不穷，例如具有社交、购物、学习等等功能的网站。这些网站中一般包含着用户对新闻事件、电影音乐、商品优劣等等的评价信息，而这些评价中往往带有用户的主观情感倾向，通过对这些主观情感进行分析就可以判断出用户的喜好，这对个性化推荐、舆情分析、兴趣圈划分等等具有重要的研究意义和商业价值。由于这些评价的信息大多以文本的形式呈现，那么如何准确、快速的从文本中提取用户的情感吸引了广大学者竞相研究，文本情感分析这一具有理论与实际研究意义的热门研究也因此应运而生。　　但是网络的快速发展带来了用户数据的指数型增长，面对如此海量的数据使用人工进行情感分析几乎是不可能完成的任务，如何利用计算机快速准确的从海量的数据中挖掘出用户的情感信息是文本情感分析的研究重点。依据文本的粒度，情感分析还可以分为词语级、句子级和篇章级，其中词语级是所有粒度研究的基础，依据文本的细粒度特征对句子或篇章进行情感分析，通过对细粒度文本的研究进一步提高文本情感分析的准确度与实用性。　　常见的文本情感分类方法主要有基于情感知识的方法和基于特征分类的方法，但由于网络新词的不断涌现，情感知识更新并不及时，从而导致基于情感知识方法具有一定的局限性，而基于特征分类的方法在选择特征的时候往往并没有将情感词等情感知识考虑其中。因此，本文将两种方法进行了结合，提出了一种基于机器学习的细粒度文本情感分析方法。通过对现有特征选择与权重计算算法进行分析和筛选，发现现有的算法未能充分考虑情感词、修饰词的影响，在现有特征选择与权重计算的算法的基础上进行改进，提出了更适合情感分析的 N-CHI 特征选择算法和W-TF-IDF权重计算算法，增加了情感词在特征词中的比例与权重。　　同时，鉴于积极与消极的二元情感分析方法无法有效反映用户情绪化意图，所以本文中还提出了一种基于 BP 神经网络的多元情绪分析方法。在该方法中，将原有的二元分类识别提升为多元情绪化分类方法，有效解决了对用户情绪缺乏表达的问题，同时使得情感分析更加细粒度，使其提升到了情绪化层面。　　本文以现在热门的微博评论作为数据集，通过实验证明基于机器学习的细粒度文本情感分析方法和基于 BP 神经网络的多元情绪分析方法对情感词与修饰词的利用率高于其他算法，并在情感分类的过程中充分发挥了其作用，改进的算法有效的提高了情感分析的正确率，尤其对消极的情感分类正确率有较高的提升。在与其他同类研究方法对比该方法具有较高的分类正确率与普适性，同时实验结果还表明，对于单一话题的数据集上比多话题的数据集上的分类正确率更高。

其他文献

网络管理中基于SNMP的网络拓扑自动发现

计算机网络技术从二十世纪七十年代开始到现在已经经历了三十多年发展历程,如今,计算机网络技术已经日渐成熟。今天,计算机网络作为信息社会的基础设施已经日益深入到国

学位

网络管理网络拓扑局域网

楞次定律的理解和应用

楞次定律内容:“感应电流具有这样的方向,即感应电流的磁场总要阻碍引起感应电流的磁通量的变化.”楞次定律的表述简明扼要,高度概括.那么,如何理解呢?rn一、对楞次定律的理

期刊

楞次定律感应电流磁场闭合电路磁通量物理量关键词

浅谈力学观点、能量观点和动量观点在解题中的合理运用

纵观近几年的全国各地高考物理试题,不难发现关于力和运动、动量和动能的考查试题都是历年高考中的常见题型,且常考常新,主要考查学生的分析综合能力、推理能力和利用数学解

期刊

力学观点能量观动量定理解题力和运动动能定理分析综合能力高考物理试题学生物理问题推理能力考查解决问题教学经验规律常见题型运用题目

基于SOAP协议的统一接入系统设计与实现

随着彩铃、同号、号码携带等新的电信增值服务类型的增加，以及电信企业为用户提供服务方式的扩展，电信业务运营系统与众多增值服务平台的互联问题变得越来越复杂，系统难于管理和

学位

南澳大利亚夏秋期间草地类型对断奶绵羊生长和羊毛产量的影响

在南澳地区春羔的生产能力较秋羔要高,但是春羔断奶时,正是草地的成熟期,牧草干枯,结果引起断奶羔羊生长发育受阻。为此在不同土壤类型上建植各种人工草地,来比较围栏养育断

期刊

草地类型人工草地春羔发育受阻建植断奶羔羊南澳大利亚土壤类型波斯三叶草羊毛产量

计算化学e-Science脚本编辑环境设计与实现

e-Science主要研究科学领域的全球合作以及与之相适应的基础体系结构，它将对未来的科学研究方式产生革命性的影响。网格(Grid)是使e-Science成为可能的基础体系结构。计算化学

学位

计算化学脚本编辑网格平台分子信息学资源共享

地铁供电系统运行状态监测系统的设计实现

随着我国城市化的快速发展，地铁在城市交通体系中所处的地位日益显著，成为必不可少的交通工具。地铁供电系统的可靠性和稳定性是保证地铁安全运行的必要条件。如果供电系统一旦

学位

地铁供电系统运行状态监测系统

整合考题,提升高三化学复习的效果

一、问题提出rn高三化学复习怎么整?做题、训练是常态化教学,但是是不是搞题海战术?实践经验表明,搞题海战术高耗低效,学生复习很累,而且效果不佳,容易出现学习疲劳,甚至有些

期刊

整合考题提升知识点中学生高三化学复习题海战术目标达成度变式训练学习疲劳效果不佳其他学科技能目标高考高耗低效改编题方法注意力常

基于博弈论的认知无线电频谱访问研究

认知无线电是近年新提出的一种无线通信的技术，它利用未授权通信用户的频谱感知能力，动态的自适应的使用空闲频谱资源，从而提高整个频谱的利用率。认知无线电用户可以感知外部环

学位

认知无线电博弈论频谱访问

贵金属业务管理系统的设计与实现

自2002年10月上海黄金交易所成立,国内商业银行尤其是五大国有银行进度飞快的参与到贵金属交易行业中来,银行贵金属交易量增长迅速,为银行带来了丰厚的利润,贵金属业务已在银

学位

商业银行贵金属SpringMybatis

细粒度文本情感分析

其他学术论文