基于深度学习的网络评论情感分析技术研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:yuekinger
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,很多人在网络上发表自己对事物的看法和评价,通过对这些数据的分析可以得到不同的人对于某一种事物的情感倾向。如何运用自然语言处理对网络评论文本进行分析是目前文本处理的一个热点,情感分析也是其中一个重要的任务。而要实现从评论文本到情感分类的一体化设计,主客观分析显得尤为重要。本文深入研究了情感分析算法的优化和主客观分析算法,主要工作如下:1、设计并实现了基于卷积神经网络和循环神经网络的情感分析算法-基于词性的门限卷积神经网络(GCNN-POS)。首先,同一词语在不同场景下有着不同的词性和词义,所以该算法以语料库为基础,对分词后的语料进行词性标注,使用word2vec模型训练词向量,将文本转化为基于词性标注的词向量形式。然后,利用双向门限循环神经网络层对文本词向量提取上下文语义信息,利用卷积神经网络对文本进一步提取特征,降低词向量维度。最后,利用sigmoid函数将实验得分的结果转换为相应的概率进行分类。2、首次将深度学习算法运用到主客观分析任务中,并根据主客观分析任务的特点提出了基于注意力机制的双向门限循环神经网络(AT-BiGRU)模型。本文不再依赖特征工程的方法,而是采用表现更优秀的深度学习的方法,对主客观文本进行特征学习。本文在双向门限循环神经网络层的基础上加入注意力机制,为文本深层信息赋予相应的权重,计算出文本中重要的词语权重和位置。为了验证提出的算法的有效性,本文在ChnSentiCorp和IMDB语料上做了情感分析的对比实验。研究结果表明,GCNN-POS模型在情感分析任务上获得了更好的效果,分别在ChnSentiCorp和IMDB语料上达到了95.1%和90.3%的F1值。本文在微博评论数据集上做了基于AT-BiGRU的主客观分析实验,和现有的基于统计的方法与基于传统机器学习的方法相比,减少了人工提取特征的过程,简化了操作,且取得了不错的分类准确率,F1值达到76.2%。
其他文献
根据国家标准对不锈钢食具容器迁移量的要求,立足腐蚀理论和扩散理论,分析不同焊接方式对待检元素迁移量的影响。研究表明,各种焊接方式会对不同元素的迁移量产生影响,且影响程度
世界卫生组织(WHO)称,一项有关政府通过饮食和运动帮助大众防止慢性疾病的全球计划最终草案并未因产业部门的压力而搁浅。 2002年,WHO成员国曾要求出台一项计划,帮助他们克服
作为文化产业的一支重要力量,广电行业正在成为我国经济的增长点。与此同时,广电媒体学习现代企业的文化管理经验,企业文化建设之风蔚然兴起。本期推荐的两篇文章,是捷盟咨询对广
网络视频对于广大网民已经不是陌生的概念了,  有越来越多的人在享受它的内容。  对于互联网来说,  网络视频代表网络内容展现形式的变革,  而这种变革将带来网络视频广告业的空间发展。    盛宴开幕,蛋糕巨大    2005年岁末,土豆网的融资成功预示着网络视频的诞生,也预示着网络视频广告的开端。2006年岁末,当Google用16.5亿并购了美国最大视频网站YouTube的消息传来,就有人预言,
当前,电子商务正改变着人们的生活方式和购物模式。网购时代,手机轻轻一点即可选择心仪的商品,随之而来的是物流行业的蓬勃发展。物流不仅是联系商家和用户的一条重要纽带,更
目的探讨PICC置于肘下近端背侧贵要静脉改进肢体位的可行性。方法置管部位选为肘下近端背侧贵要静脉,在改进肢体位及体位下,执行穿刺、送管、维护和拔管。结果改进组37例与同期
目的探讨口服培菲康对肝硬化患者肠道通透性和血浆内毒素水平的影响。方法将68例肝硬化患者随机分为对照组和培菲康组。对照组患者给予常规保肝、利尿和对症支持治疗;培菲康组