评论文本情感倾向性分析方法研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:lenvy11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,电子商务和社交平台的涌现,大量用户在互联网上发表观点和看法、抒发情感和表达见解,产生了大量的短篇或长篇评论。利用自动情感倾向性分析技术挖掘海量评论文本所包含的情感倾向,能够发现大众的情感演化规律,为制定营销策略和监控社会舆情提供决策支持,具有重要的应用价值。然而,由于短文本评论的有效情感词少,长文本评论的篇幅长、正负情感特征分布离散,现有方法仍存在较大的提升空间,因此论文分别针对短文本和长文本评论情感倾向性分析中存在的难题进行研究。论文的主要成果和创新包括:(1)提出了一种扩展语义相似情感词的短文本情感倾向性分析方法。针对由于短文本评论有效情感词少导致的情感特征稀疏问题,提出一种基于扩充语义相近情感特征的短文本情感倾向性分析方法。该方法首先基于词嵌入相似性度量扩展语义相似的词语为情感特征,然后联合文档频和词频(DF-TF)特征进行特征降维,最后利用Adaboost算法进行情感分类。在酒店和手机评论语料上进行实验,结果表明,情感分类正确率高,分类效果较好。该方法通过计算词间语义相似度扩充情感词有效地丰富了短文本的情感语征,提出的文档频-词频特征降维方法进一步提升了情感分类的正确率。(2)提出了一种基于注意力双层LSTM的长文本情感倾向性分析方法。针对由于长文本评论篇幅长,正负情感特征离散分布且每个句子的的情感语义贡献度不同,导致难以准确判断全文情感倾向的问题,提出一种基于注意力双层LSTM的长文本情感倾向性分析方法。该方法首先利用LSTM学习句子级情感向量表示;然后采用双向LSTM对文档中所有句子的情感语义及句子间的语义关系进行编码,并基于注意力机制对具有不同情感语义贡献度的句子进行权值分配;最后,加权句子级情感向量表示得到长文本的文档级情感向量表示,经过Softmax层得到长文本情感倾向。在Yelp2015和IMDb电影评论语料上实验,结果表明该方法能达到了较好的分类效果,进一步提升了情感分类的正确率。(3)构建了一个评论文本情感倾向分析的原型系统。为了实现判定评论文本情感倾向性,设计并实现了一个评论文本情感倾向分析系统。系统采用B/S架构,主要功能包括预处理、短文本情感倾向判定、长文本情感倾向判定和结果显示。系统中各模块相互独立,在模块间采用文件的方式进行数据交互,降低模块间的耦合度,系统界面友好、兼容性强、稳定性好。
其他文献
市场传闻作为一种突发、非预期的金融市场现象,常引起上市公司股价的非理性波动,也增加了上市公司在澄清和维护企业形象方面的投入,影响了金融市场效率。已有的针对国内股市
为解决人口结构问题所带来的一系列社会问题,我国正在逐渐放开生育政策。“单独二孩”政策实施以来,各方研究数据表明,该政策虽然对生育行为起到一定的促进作用,但我国生育率
伴随着中国综合国力的进一步增强,尤其是“一带一路”战略构想的提出,更大规模的海外学术人才将实现向中国“回流”。然而截至目前,学术界有关“一带一路”学术人才流动仍缺
国际贸易对当代国际事务有重要影响,对各国和世界经济的发展起着重要作用。中国是一个贸易大国,自2001年加入世贸组织以来,中国的贸易一直在高速增长,同时中国与“一带一路”
近年来,包括中国电力行业在内的全球电力行业面临着越来越激烈的市场竞争和越来越严格的环境规制,在此条件下为电力行业企业和政府监管部门开发新的绩效评价工具以适应新的评
在如今环保背景下,纯电动汽车受到广泛关注,政府和企业都在大力推进纯电动汽车产业发展,然而消费者对其购买意愿仍不高。目前针对纯电动汽车的影响因素的研究已经较为成熟。
近几年,国内互联网金融发展迅速,众筹作为互联网金融的一种模式,在帮助中小企业和普通民众投融资方面起到了重要作用,推动了普惠金融的发展。国内众筹融资兴起于2011年,经过
雷达回波模拟器是雷达的重要测试设备,用于模拟雷达目标回波,考核验证雷达截获/跟踪目标的能力以及功能与性能是否满足使用要求,以代替或部分代替外场试验,降低研制成本,提高
着陆敏感器是用于在飞行器下降阶段进行测高测速和飞行姿态控制的信号处理装置,其中的重要组成部分是雷达信号处理机,也是实现雷达信号处理算法的硬件平台和软件系统。信号处
双基地FMCW MIMO雷达结构简单,实时性强,可实现多角度与三维形变的测量,适用于山体边坡大范围地表监测系统。本文主要对双基地FMCW MIMO雷达系统的时频同步误差模型与时频同