面向电商评论细粒度观点挖掘的拓展主题模型研究

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:w__hailin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和电子商务技术的发展,网络购物成为一种热潮,人们可以实现足不出户购买到自己心仪的商品。但是,与传统线下购物相比,网络购物有着商品种类繁多、用户无法直接感受商品的质量、体验商品功能等特征,这使得电商网站上的商品评论信息成为消费者选择和购买决策的重要参考。同时,评论信息作为反馈机制也可以帮助商家改进产品、提升服务。但是,目前电商网站评论数据量巨大、内容庞杂,采用人工阅读方式无法准确有效的得到有用的信息。而且人们更希望得到的是关于产品或服务多个方面的细粒度评价信息,而非其整体情感倾向。因此,针对电商评论的细粒度观点挖掘成为了热门的研究课题,受到国内外研究学者的广泛关注。细粒度观点挖掘旨在从评论数据中抽取出被评价实体方面以及相对应的情感,生成评价摘要,,为潜在消费者和商家提供决策支持。考虑到目前细粒度观点挖掘方法如基于人工定义、基于频率、基于有监督学习方法的局限性,而LDA主题模型作为无监督方法不仅不需要人工标注的训练数据,还可以克服上面所述方法中没有将具有相似语义的特征词进行聚类的缺点,被研究者广泛应用。但是LDA模型抽取的主题粒度较粗,无法识别被评价实体方面,而且三层模型无法实现细粒度观点挖掘目标,需要进行改进和拓展。针对上面提到的问题,本文根据细粒度观点挖掘的目标,对LDA模型进行设计和拓展,提出了细粒度的主题情感混合模型(Fine-grained Topic Sentiment Unification Model,FG-TSU 模型)。首先针对标准的LDA模型识别出的主题粒度较粗,本文将主题分为局部主题和全局主题,利用滑动窗口的方法将词共现信息从文档级降到句子级,实现细粒度局部主题的抽取;然后,本文根据词分类和在模型中引入指示变量用以区分方面词和观点词;最后,本文在LDA模型的三层模型基础上加入了情感层,对主题和情感进行同时建模,实现情感倾向分析,不仅可以获得整篇评论的情感极性,还可以获得被评价实体方面层的情感极性,最终完成细粒度观点挖掘的目标,生成评价摘要。为了验证本模型具有跨领域性,本文选取了酒店和手机两个领域的电商评论数据集进行实验,设计了三个实验,实验结果表明本模型在实现电商评论细粒度观点挖掘上的可行性。
其他文献
人力资源管理不仅仅是一门学科,它还是一种文化。人力资源管理的产生是基于西方文化的,因而西方文化的一些特征,如理性、独立以及创造的价值观等都能在人力资源管理中得到体
对邻二甲苯氨氧化制备重要的化工原料邻苯二腈进行了研究 ,评比、筛选到高效的 o- 116号催化剂 .考察了反应温度、空气比、氨气比和空间速度对邻二甲苯转化率、邻苯二腈的摩
食品追溯是保障食品安全的重要手段,而食品追溯制度则是保障食品追溯施行的基石。文章通过对世界主要发达国家的食品可追溯制度对比分析,提出我国在食品追溯制度建设中需要注
本文探寻低碳经济视角下广东对外贸易发展模式转型的相关对策,为广东贸易的可持续发展提供理论依据、可行路径。发展低碳经济是大势所趋,本文首先对广东省对外贸易现状做了适
幼儿在图形认知以及空间方位、空间运动、空间定位、空间转换、空间想象等方面有不同的年龄特点。研究者根据幼儿不同的年龄特点探索了3~6岁幼儿图形以及空间关系学习的路径
针对煤层自然发火标志气体中烷烃气体吸收光谱交叠严重、定量分析时需要大量样本进行标定的问题,对甲烷、乙烷、丙烷、异丁烷、正丁烷5种气体吸收光谱谱图进行研究,分析了谱
随着5G时代的到来,股市的"画风"也在近期有了新动向,就A股市场来看科创板行将成为市场的新主线,而一路"看涨"的电子元器件成了时下最"吸金"的产业。相关数据显示,我国电子元
人才资源管理工作的好坏会直接影响到企业的生存和发展,而在人力资源战略中,人力资源规划是其中一项不可缺少的重要内容。对于企业来讲,人力资源是企业的重要职能战略,对我们
由于气体绝缘输电线路(Gas-Insulated transmission Lines,GIL)的载流能力与温度相关,本文提出了一种基于有限元分析的GIL温升计算方法。为了研究GIL的负荷电流、气体压强、
商品评价的识别及倾向性分析近年来已成为自然语言处理领域的热点研究问题。相对于一般的商品评价,商品细粒度评价能够更细致、准确地反映出顾客购买商品的心得。这些信息一