论文部分内容阅读
近年来,随着信息科学技术的发展,人工智能引起了一次次信息时代的潮流。目前,情感分析已经是人工智能领域最活跃的技术之一。截至2019年6月,我国上网人数的规模已经达到8.54亿。其次,随着社交网络的渐渐成熟和手机移动等技术的发展与普及,众多网民已经习惯于在网络上发表评论,这些评论中存在着不可忽视的商业经济价值。比如微博评论,微博管理者可以分析评论数据对舆情进行监控;购物网站,网站管理者可以把历史评论数据分析汇总以便制定公司商业策略;汽车论坛,消费者们可以通过采取相关数据分析决定自己的购买意向。这使得情感分析在当今信息社会应用广泛。现有的文本情感分析方法主要有:基于情感词典的方法、基于机器学习的方法和基于深度学习的方法三大类。其中基于词典的情感分析方法很大程度上依赖于情感词典的细致度和覆盖度,而基于机器学习的则依赖人工构建选取特征和标注相关信息。近几年,随着深度学习的快速发展,越来越多的研究者投身至深度学习的情感分析方法研究中,去改进相关网络模型结构以求达到更好的效果。首先,本文在第一章对于目前的情感分析技术现状进行了详细的介绍,并给出了本文主要研究的内容以及创新点。其次,对文本预处理和特征提取、情感分析过程等进行了相关的阐述。然后,本文的主要两章的具体研究内容如下:(1)针对国内很多词典没有情感值这一属性,从而无法对句子或文档计算情感值的现象。首先,第三章提出了一种利用词语相似度给无标注情感词典标注情感值的方法。即通过计算无情感值词与种子词的语义相似度,再与种子词的情感权值相乘得到标注值。然后,根据所标注的情感词典计算得到句子的情感分值,从而实现基于词典的情感分析。最后,在第三章的在实验中证明了本方法的有效性,对构建及完善特定领域词典有一定的作用。(2)目前国内外对文本处理有常见的几种经典的神经网络模型。第四章提出了一种神经网络情感分类模型,该模型是结合了CNN和双向LSTM网络,把CNN的输出作为双向LSTM的输入,再把双向LSTM的输出作为自注意力机制层的输入进行训练。并与之前的各种神经网络模型在Amazon Auto和Amazon Musical Instruments评论文本分类实验数据上的效果进行对比,结果显示了本文神经网络情感分析模型在情感分析上的有效性。最后,就本文的研究工作和研究内容做出了总结,并给出了在未来下一步的思考方向和研究内容。