论文部分内容阅读
随着网络的发展,很多人在网络上发表自己对事物的看法和评价,通过对这些数据的分析可以得到不同的人对于某一种事物的情感倾向。如何运用自然语言处理对网络评论文本进行分析是目前文本处理的一个热点,情感分析也是其中一个重要的任务。而要实现从评论文本到情感分类的一体化设计,主客观分析显得尤为重要。本文深入研究了情感分析算法的优化和主客观分析算法,主要工作如下:1、设计并实现了基于卷积神经网络和循环神经网络的情感分析算法-基于词性的门限卷积神经网络(GCNN-POS)。首先,同一词语在不同场景下有着不同的词性和词义,所以该算法以语料库为基础,对分词后的语料进行词性标注,使用word2vec模型训练词向量,将文本转化为基于词性标注的词向量形式。然后,利用双向门限循环神经网络层对文本词向量提取上下文语义信息,利用卷积神经网络对文本进一步提取特征,降低词向量维度。最后,利用sigmoid函数将实验得分的结果转换为相应的概率进行分类。2、首次将深度学习算法运用到主客观分析任务中,并根据主客观分析任务的特点提出了基于注意力机制的双向门限循环神经网络(AT-BiGRU)模型。本文不再依赖特征工程的方法,而是采用表现更优秀的深度学习的方法,对主客观文本进行特征学习。本文在双向门限循环神经网络层的基础上加入注意力机制,为文本深层信息赋予相应的权重,计算出文本中重要的词语权重和位置。为了验证提出的算法的有效性,本文在ChnSentiCorp和IMDB语料上做了情感分析的对比实验。研究结果表明,GCNN-POS模型在情感分析任务上获得了更好的效果,分别在ChnSentiCorp和IMDB语料上达到了95.1%和90.3%的F1值。本文在微博评论数据集上做了基于AT-BiGRU的主客观分析实验,和现有的基于统计的方法与基于传统机器学习的方法相比,减少了人工提取特征的过程,简化了操作,且取得了不错的分类准确率,F1值达到76.2%。