基于深度学习的评论文本情感分类系统设计与实现

来源 :新疆大学 | 被引量 : 0次 | 上传用户:nicolewyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的飞速发展,人们越来越多的在网络中发表自己对每个商品质量、客户服务态度以及物流速度的观点、看法,这些数据是有价值的:这些数据能给客户选择某个商品时一些参考,而且也能让商家改善自己的服务从而更好的获取用户,甚至还能从这些数据中发现新的需求、新的商机。但这些数据通常都是非结构化的文本数据,不便于计算机的自动的归类、分析、处理。将这些文本数据进行一定的建模从而更容易的提取它的特征是一个很重要的课题。目前,传统的情感分析的方法主要是要人工的构建情感词典以及针对不同领域的语料选择不同的特征选择方法,这显得比较繁琐、费时费力。本文在分析、总结传统情感分析方法的优缺点的基础上,使用深度学习的方式来自动化的提取文本的情感特征。具体而言,就是使用训练好的卷积神经网络提取评论的特征,然后将其送给训练好的支持向量机完成文本的情感分类。这么设计的主要原因是结合了深度学习自动提取特征以及支持向量机良好的分类性能的优点。另外,还做了该方法与传统机器学习方法进行情感分析的对比试验,来验证该方法的理论的正确性,实验显示说明该方法在评论文本情感分析的准确度有了2个百分度的提高。最后,根据提出的情感分析的思想,开发设计了一个美团外卖评论文本情感分析系统,它可以实时的爬取美团外卖系统中的评论文本并进行分析。它完成语料的收集和预处理、词向量的训练、情感模型的生成以及情感分类的功能,并且可以清晰的展示文本情感分析后的结果,使用方便。该系统主要包含以下功能模块:1、语料的收集与预处理模块:语料的收集需要编写一个爬虫,用广度优先搜索的算法搜索网页,然后解析网络提取内容并保存在本地。语料收集好后对语料使用分词工具进行分词、去停用词处理。2、情感模型的训练模块:使用词向量工具word2vec来训练维基百科中文语料来获取词向量模型,然后用预处理之后的语料且标记好的语料来训练卷积神经网络,生成情感模型并保存。3、文本的情感态度分析模块:文本情感态度的分析先要完成支持向量机的训练,然后用生成的情感模型处理要预测的文本,提取文本的特征,最后用训练好的支持向量机对特征进行分类获取文本的情感极性。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在油藏工程中,广义翁氏预测模型、双对数型产量衰减曲线预测模型和水驱曲线模型都是比较重要的预测模型.然而,它们都有自身的局限性.现将这三种方法相结合,除详细说明求解方
宁西铁路横贯我国东中西三大经济带,是又一条东西向的交通大动脉,该铁路的开通必将对六安市区域经济产生重大影响.本文在六安市区域经济现状分析的基础上,从六安市产业结构产
目的观察益气活血法对缺血性脑卒中患者颈动脉粥样硬化斑块的影响。方法将120例患者按照随机数字表法随机分成两组,各60例。对照组给予口服阿托伐他汀钙片治疗,治疗组在此基
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在石油加工过程中,原油、馏分以及得到的石油产品中存在许多物质,造成设备腐蚀,这是当今石油炼制工业中亟待解决的问题。本文通过静态腐蚀法,模拟石油酸种类、不同类型石油酸协同作用、水分、硫化物、氮化物等不同因素引起的炼油过程中的腐蚀,运用激光显微拉曼光谱技术、真空扫描电子显微镜表征腐蚀形貌;X射线能量色散光谱、电感耦合等离子发射光谱仪、傅里叶红外光谱等表征腐蚀产物的组成;并结合腐蚀速率进行分析。研究结果
在语文阅读教学当中,情感把握失衡,这是目前许多语文阅读教学容易出现错误的地方,教师对于学生阅读教学的情感引导、感情激发、阅读共鸣等,没有把握到位。分析阅读教学中情感
广东南方卫视曾先后推出两部系列专题片《世纪传承》和《岭南记忆》,纪录并宣传广东的二十五项珍贵的非物质文化遗产及其传承人的故事。笔者有幸参与到这项巨大工程的前期策