面向个性化推荐的在线评论细粒度情感分析研究及应用

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:ellen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的逐步成熟与移动网络的高度普及,电商平台飞速发展的同时也带来了较为严重的产品信息过载问题。个性化推荐作为缓解“信息过载”问题的一大利器,越来越受到人们的重视。但传统基于评分数据的推荐系统无法准确挖掘用户的真实偏好,其推荐结果也缺乏可解释性。用户作为信息的“创造者”,在活跃于各类在线平台的同时也留下了大量与平台交互的数据,其中由用户主动撰写的评论文本数据包含非常丰富的用户细粒度情感倾向信息,这些信息能够显式地体现产品在各方面的特征信息以及用户对产品各方面的真实偏好,非常适合用于诸如个性化推荐、产品反馈等任务。但此类产品评论多属于长文本,普遍存在文本信息冗余、特征稀疏的问题。针对上述问题,本文通过构建性能更强的细粒度情感分析模型去有效识别文本特定方面的情感倾向,并将这些细粒度情感倾向信息应用于个性化推荐。具体工作如下:(1)本文搭建了Bert-Bi GRU-CNN-Att融合模型,使用十二层双向Transformer编码结构Bert替代传统词嵌入层,充分挖掘上下文相关的文本语义信息,缓解了长文本特征稀疏的问题。同时结合Bi GRU的时序数据处理优势以及CNN网络与Attention机制强大的局部特征提取能力,缓解了长文本信息冗余的问题。实验结果表明该融合模型在细粒度情感分析任务上的性能优于其他对比模型。(2)本文基于集成学习的思想提出Union-Bert集成模型,进一步提高了细粒度情感分析模型的性能。主要通过引入Bert的变体模型ERNIE、Roberta、Bert-wwm-ext,使用不同的上下文词嵌入层再次搭建多个情感分析模型,利用餐馆领域方面级情感标注数据集和句子级情感标注数据集对这些模型进行监督训练,最终基于集成算法得到综合最优的集成模型Union-Bert。实验结果表明本文的集成模型较单模型性能有所提升。(3)本文提出了基于Union-Bert和NMF的混合推荐模型。首先基于Union-Bert提出了一种可解释性情感推荐指数ARI的计算方式,并设计相应算法利用该指数实现评分预测。其次将推荐指数与真实评分进行特征组合,实现了基于Union-Bert和非负矩阵分解算法NMF的混合推荐。最后设计多组混合推荐模型进行实验对比,实验结果表明本文的混合推荐模型在评分预测任务上的误差率低于其他对比模型。
其他文献
近年来,经济的腾飞发展也带动了房地产市场的繁荣发展,为了控制房价,避免房地产市场升温过快,国家出台了一系列限购政策,希望能够有效控制人们的购房欲望,来帮助房地产市场秩序逐渐恢复平稳,各地区会结合当地的实际情况考虑是否采取相关政策。与此同时,国家愈发重视社会福利,更加关注低收入、住房困难的群体,为他们解决住房困难,力推保障性质住房的政策。在这样的大背景下,部分人受到利益或其他各种因素的驱使,导致借名
在线医疗社区的出现,在方便人们获取健康信息和求医问诊的同时,也改变了患者选择医生的标准。对于线下的传统医疗机构,由于难以获知医生给先前患者的治疗过程和效果,新患者只能通过替代医生专业能力的指标(如职称、从业时长、医院等级等)来选择医生;而在线医疗社区除了能展现线下代表医生专业能力的指标外,还可呈现医生和患者互动过程的相关信息,如医生的回复时间、态度、业务水平以及患者的评价、满意度等等,这些信息将影
中国的高科技领域在过去几十年间发展迅速,极大地推动了中国的经济发展,并且几乎影响着中国的各行各业。然而,许多生活在西方世界的人对中国仍然有着刻板的印象。近些年来,中国拍摄了一系列纪录片,向外界介绍自己的发展和呈现最新面貌。纪录片《青春中国》选择以不同视角,呈现当代中国在高科技领域的新成就。笔者认为,将《青春中国》口译至英语,能够帮助外国人对当代中国有一个更为客观的了解。本实践报告旨在对现场口译过程
本文是一篇实践报告,报告内容基于主题为“吉林松花湖生态环境综合改善项目”的会议。本次口译任务为汉英同传,发言内容主要为农业、气候、金融、公共咨询等,术语繁多,且发言口语特点明显,对于学生译员来说总体难度偏大。笔者通过转录现场录音,并分析文本,针对口译中出现的问题探讨相应的翻译策略和解决方案,希望这些研究结果能对今后的口译技巧和实践者具有一定启示和参考价值。通过分析口译文本和回顾口译现场,遇到的问题
互联网行业作为我国经济社会数字化发展和转型的重要驱动力,当前正面临市场增速放缓、人口流量红利逐渐消失以及获客成本逐步高企的挑战,互联网企业因此亟需加快传统业务转型调整的步伐、寻找发展的新兴动能。在此背景下,直播电商被视为当前互联网行业实现经济增长的新趋势,且网红与直播电商的结合能有效降低获客成本、促进电商营销的转化,成为突破流量瓶颈的新出口。网红直播电商是指拥有一定人气和吸引力的网红,以更具互动性
近年来,可转换债券在我国债券市场规模逐渐扩大。对于可转换债券的制度设计以及发行管理,我国已经从刚开始的探索和学习阶段,发展到现在比较成熟。为了应对变幻莫测的资本市场和金融环境,我们有必要对企业财务管理中对于可转换债券的投资选择做出进一步的研究。可转换公司债券是可转换证券的一种。从广义上讲,可转换证券是一种持有人有权将其转换为另一种不同性质的证券(例如期权和认股权证)的证券。从狭义上讲,可转换证券主
改革开放40年来,我国民营经济的发展取得了重大成就,为稳增长、促创新、增就业、强民生做出了重大贡献,已成为我国经济制度的内在要素,是社会主义市场经济发展的重要成果。可以说,民营经济是我国全面建成小康社会、进而全面建设社会主义现代化国家新征程中不可或缺的核心主体,民营经济只能壮大,不能弱化,更不能“离场”。当前,人才竞争已成为制约民营经济发展的瓶颈性问题,如何突破瓶颈顺势而为,是必须解决的关键性战略
大学章程的制定是推动我国高校依法治校,完善现代大学制度的重要改革举措。作为高校的顶层设计,大学章程对高校内外重大事件进行了明确规定,为学校的正常运行提供保障。进入二十一世纪,我国开启章程建设时代,目前,各大高校已经基本完成章程建设工作。然而,我国高校种类繁多,章程建设起步较晚,实际制定实施中出现了较多问题。根据市场人才需要而转型成地方应用技术大学的高校是高等教育的重要组成部分,针对这类高校进行章程
本文以沦陷时期苏州的米价变动与社会应对为切入点,开展沦陷时期苏州社会生活状况研究,以期丰富抗战时期沦陷区社会生活史和苏州城市社会史的研究。沦陷时期的苏州长期是伪江苏省省会,日伪政府为控制苏松常嘉这一产米区,对苏州及其附近的统治颇为严厉,在政治经济文化等多方面均有专门的政策,并发起“清乡”运动以求进一步加强统治。因为战争的持续影响,再加上日伪政权收购军米、米商囤积居奇及货币币值不稳定等因素的影响,导
氟虫腈是一种广谱杀虫剂,能与害虫体内的神经递质-γ-氨基丁酸(GABA)受体结合,通过影响中枢神经系统的功能将其杀灭,因其杀虫效果良好且对作物无毒害作用而被广泛使用。但氟虫腈半衰期较长,对环境不利,可在动物和人体内富集而产生毒副作用,因此对氟虫腈残留进行检测和控制是非常必要的。目前,氟虫腈残留的检测方法主要有高效液相色谱法(HPLC)、高效液相色谱-串联质谱法(HPLC-MS/MS)、气相色谱法(