基于情感分类的酒店评论短文本主题挖掘

来源 :浙江工商大学 | 被引量 : 2次 | 上传用户:jiansilang2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近几年社交网络的迅猛发展,网络用户愈发频繁地在互联网上发表自身的评论和观点,这些评论和观点呈现爆炸式增长,其中包含用户情感等信息,这些信息在舆情监控、商品改进和产品推荐等方面有着重要意义。文本情感分类研究顺应这一发展趋势,成为了一个研究热点。随着社会经济的发展,人们生活水平的提高,旅游客户在关注酒店消费价格的同时,更注重精神层面的感受,更关注服务体验。客户完成体验之后,在网络上发表的评论成为了未来用户选择酒店时的重要参考。而经济型快捷酒店由于价格定位低,分布范围广,成为了人们出游的首选。本文首先通过八爪鱼爬虫工具,从携程网站获取杭州地区如家酒店和汉庭酒店的客户评论。针对原始语料,通过数据清洗预处理等步骤,获得如家酒店评论18685条,汉庭酒店评论19690条。接着在统计词典的基础上,构建自定义酒店领域情感词典,对评论文本进行分词处理,利用分词结果训练词向量。然后将带有情感标签评论的词向量作为输入变量,对TextCNN卷积神经网络进行训练,将训练好的网络模型,对未带有情感标签的评论进行情感分类。得到如家酒店积极评论14547条,消极评论4138条,消极评论占比22.15%;汉庭酒店积极评论14390条,消极评论5308条,消极评论占比26.95%。最后分别对两家酒店各自的积极评论和消极评论文本进行LDA主题挖掘,利用LDAvis可视化结果,分析两家酒店各自的优势和劣势,并提出针对性意见。最终分析结果显示,从研究方法角度来看,TextCNN卷积神经网络在文本分类方面表现十分优异,分类结果显著;LDA主题模型对于分析如家和汉庭两家酒店存在的问题具有独到优势。从酒店发展角度来看,如家和汉庭两家酒店的优势大于劣势,如家酒店的用户反馈优于汉庭酒店。如家酒店的积极评论显示如家酒店设施齐全,分布范围广并且有免费房间升级等服务;消极评论显示除了经济型快捷酒店的共同问题,如家酒店未提供早餐和停车等服务受人诟病。汉庭酒店的积极评论显示汉庭酒店提供接送机服务,环境较为舒适,分布集中在西湖景区;而消极评论指出的问题较多,除了经济型快捷酒店的共性问题,其设施较为陈旧、另外洗护用品不齐全和服务态度差都令用户感到失望。
其他文献
目的探讨协同护理模式对糖尿病肾病患者代谢指标与饮食依从性的影响。方法选取本院收治的108例糖尿病肾病患者进行对照研究,对照组采取常规护理,观察组在常规护理的基础上,采
输电线路绝缘子的污秽闪络是影响电网运行的重大隐患之一,受各地区气象条件、地理环境和周边工业污染物的影响,绝缘子的污闪事故频繁发生,因此对于其污闪机理与放电模型的分
数字媒体的兴起,对于企业的品牌形象塑造来说,既有危,同样也有机。本文拟以中国平安保险(集团)股份有限公司为例,重点分析数字媒体环境下企业品牌形象塑造所遇到的危与机,并
公共文化服务建设,是全面建成小康社会伟大实践的一项重要任务。党的十九大报告明确指出,满足人民过上美好生活的新期待,必须提供丰富的精神食粮,完善公共文化服务体系,深入实施文化惠民工程,丰富群众性文化活动。2015年8月,文化和旅游部、财政部公布了第三批国家公共文化服务体系示范区创建城市名单,福州市位列其中。2015年以来,福州市文化部门和公共文化单位紧紧围绕2020年全面建成小康社会的目标,完善社区
为提高对彩色人脸的识别率,提出一种基于Fisher块对角局部非负矩阵分解(LNMF)的识别算法。采用块对角矩阵编码彩色图像不同通道的颜色信息,在LNMF算法中增加块对角约束和Fisher判别约束,对不同通道的颜色信息同时进行计算并融入人脸的类别信息,用于提取人脸特征。在CVL和PIE彩色人脸数据库上的实验结果验证了该识别算法的有效性。
从古至今,国内民众在饮食方面具有较高需求,在社会发展的进程中,饮食文化也获得了诸多方面的发展。另一方面,随着人民群众收入方面的增加,针对饮食方面的需求也产生了相应改变,逐步朝着绿色、健康的角度发展。与此同时,又将其同审美相结合,强调餐饮产品兼顾口感、味觉、视觉、嗅觉等感官体验,且日益凸显定制性、多元化体验特征。然而,正是由于这一原因,进而导致餐饮行业在发展过程中出现了一系列问题。具体来讲,餐饮企业