基于卷积神经网络的在线商品评论情感倾向性研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:ok524500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网规模和重要性的不断增长,在线商品评论的数量和影响日益剧增。在线商品评论通常是消费者做购买产品或服务的决策时十分重要的影响因素,也是确定这些产品或服务民意信息的宝贵来源。挖掘在线商品评论所携带的情感信息,分析消费者的情感倾向,对在线零售商和服务提供商均有着重要的意义。由于研究人员在情感倾向性分析领域孜孜不倦的努力,迄今为止,情感倾向性研究取得了较大的进展。在线商品评论中蕴含着消费者的主观情感信息,为了获取消费者的情感倾向性,需要利用自然语言处理的方式,处理评论文本。受限于语言的复杂多变,长期以来,自然语言处理都是一项十分艰难的任务,再加上在线商品评论中不可避免的包含垃圾评论,这便使得利用在线商品评论挖掘消费者情感倾向性存在以下两个需要解决的问题:(1)垃圾评论在一定程度上误导了观点挖掘系统,降低了系统的精度,如何解决垃圾评论问题,减少垃圾评论对系统的影响,是倾向性分析所面临的问题之一(2)针对在线商品评论复杂的语言现象,如何捕捉新词、否定词、比较词、不同情感倾向性的情感词对评论情感倾向性的影响,能否构建一个合理的在线评论情感倾向性分析模型,是提高评论倾向性分析的关键所在。本文针对上述问题,确立研究内容。主要工作如下:(1)针对垃圾评论影响倾向性分析的问题,本文提出了一种基于模型集成的产品垃圾评论识别方法。该方法利用评论内容和统计信息构造特征向量,将逻辑斯蒂回归作为次级学习器,通过stacking的方式集成了逻辑斯蒂回归、支持向量机、随机森林、神经网络等初级学习器。该方法在2015年第七届中文倾向性分析评测垃圾评论识别任务的所有模型中表现较好。(2)针对在线产品评论的特点,本文提出了一种基于卷积神经网络的产品评论情感倾向性分析方法。该方法以单个字为基本单位,利用worde2vec工具训练字级别词向量,将字级别词向量作为输入,利用不同大小的卷积核抽取句子特征,最后利用softmax模型对在线商品评论进行情感倾向性分类。实验表明,本文构建的模型能够较准确的识别在线商品评论的情感倾向性。
其他文献
无线Mesh网络是一种新型的无线网络,它是由无线链路、路由器和终端设备组成。它有着多跳、自组织、自愈、高容量、高速率特点,具有很好的应用前景。路由协议研究是目前无线Me
近年来,数据呈爆炸式增长,数据中心已经成为处理大数据的核心基础设施。为了能够快速有效地分析和提取数据中有价值的信息,研究人员提出了分布式计算框架,如Hadoop、Dryad等
随着软件工程技术的不断发展,软件开发的中心任务由过去的代码实现为主变为现在以需求分析为主,软件需求的获取与建模成为软件工程中的研究重点。然而在需求分析的过程中存在着
随着信息技术多年的快速发展,我国已建成比较完善的国家级、省级和地方综合公安信息系统。公安应急指挥体系由传统的层级结构,逐步过渡到以各级公安指挥中心为核心的协同式系
无线传感器网络是将大量传感器节点部署在无人看管的区域,实现数据的采集和传输。目前,传感器网络在军事、工业、医疗、家居等方面都有着极其广泛的应用,是当前研究和应用的
无线传感器网络(Wireless Sensor Network)是一种自组织网络系统,在军事、医疗和公共安全等重要领域已被公认为具有广阔的应用前景。传感器节点被部署在战场等监测区域,实时
随着企业信息化进程的加快,企业的业务流程变得更加复杂化,现有的工作流管理系统技术在实际应用中存在着柔性不足、集成能力有限、互操作性不高等缺点,不能满足现代企业分布式复杂应用的需求。因此,研究分布式工作流管理系统技术对企业信息化具有重要意义。事件驱动的分布式工作流管理系统是指在分布式的、异构的、动态环境中,引入主动数据库中的ECA(Event-Condition-Action)规则来描述工作流中的任
互联网技术的飞速发展给人们的日常生活带来了极大的便利,与此同时巨大的信息量使人们迷失在信息的海洋中,造成人们需要浪费较多的时间找到自己需要的信息。随着Web2.0的迅速
随着网络通讯技术的迅猛发展与多媒体数据数字化的日益普及,使得信息的传递变得非常便捷,但与此同时,数据的安全性问题也逐渐暴露出来。特别是信息隐藏技术的广泛应用及其快
随着互联网技术的飞速发展,全世界各行各业,不同领域的人们无论是在工作、学习、还是生活上的方面面都已经离不开网络。移动网络业务在这个快节奏的时代,格外受世人瞩目,它的