基于用户评论信息的推荐算法研究

来源 :武汉理工大学 | 被引量 : 3次 | 上传用户:laijiren_ruby1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术正以十分惊人的速度发展,随之带来了信息的迅速膨胀,即信息过载问题,甚至造成信息灾难。面对庞大的信息量,人们在获取自己感兴趣的信息时往往会消耗许多时间、甚至无所适从。采用“个性化推荐”措施,对缓解信息过载问题成效显著,在诸多领域发挥着重要的作用。但是,传统推荐技术仅依靠用户对商品的评分或用户的浏览行为来分析用户偏好,并未充分利用用户评论信息,因此致使推荐结果存在偏离现象。本文以提高用户体验为目标,基于评论挖掘技术,从评论中提取有价值的信息,以实现对用户进行相关信息的主动推荐。论文所述工作通过提取评论文本的属性特征,构建用户兴趣模型,改进了矩阵分解推荐算法的SVD++模型。本文所述研究以电影信息推荐为例,主要工作如下:(1)获取评论文本属性特征。针对电影评论文本的特点,通过抽取评论文本的特征词达到获取评论属性特征的目的。现有基于统计的特征抽取技术未充分考虑文档的主题和语义信息,鉴于此,本文采用词向量技术,借助聚类算法,设计一种新的评论文档特征词抽取方法。考虑到电影评论的领域性,首先自行建立领域相关性的语料库,然后将词向量技术应用到文档特征的提取过程中,通过聚类获取评论属性特征词。实验表明使用本文方法提取电影评论文本的属性特征是可行的,且自行建立的特定领域的语料库可提高特征词抽取的效果。(2)基于评论信息构建用户模型。本文首先讨论目前应用较为广泛的用户模型表示方法,接着提出基于评论属性特征的兴趣建模方法。首先计算用户评论中属性词类别的权重,继而对用户进行属性类别表示,完成用户兴趣建模。实验表明该方法能有效表征用户在产品特征层面的关注度,实现对用户偏好的表示。(3)改进基于矩阵分解的推荐算法。传统协同过滤推荐算法中存在数据稀疏性问题,鉴于此,本文提出一种融合评论信息和评分矩阵的矩阵分解算法。该算法利用用户在产品特征层次上的偏好,获取用户之间的偏好相似度,将偏好相似度作为修正项,对矩阵分解模型中的SVD++算法进行改进。通过对比实验证明,改进的融合用户评论信息和评分信息的矩阵分解推荐算法具有较高的预测准确度。(4)实现电影推荐原型系统。设计一种推荐引擎,通过完成数据处理、矩阵计算、推荐列表生成和推荐结果展示等步骤,实现了基于JavaScript和CSS的电影推荐原型系统。
其他文献
<正>员工帮助计划(Employee Assistance Program,简称EAP)最早源于美国的企业为解决企业员工因酗酒引发的心理问题。后来社会的酗酒、吸毒和药物滥用等问题日益严重,家庭暴力
2006年,对于锦州,对于锦州工业而言,无疑是划时代的。$$    这一年,足以载入锦州史册的一件具有里程碑意义的大事让全市上下震撼、振奋。$$    请记住这一天——公元2006
学位
现如今,各种有着参差不齐的处理能力和存储能力无线智能终端在人们的日常生活中出现。本文从构建一个异构型节点无线自组网的需求出发,尝试制定异构型无线自组网的通信协议,
压力管道安装工程施工多为室外露天作业,环境条件多变,影响工程质量的因素复杂,并具有一次性生产的特点,进行质量管理和质量控制比较困难.国家对压力管道的安装有强制性的许
含噪信号利用掩蔽效应去噪后,噪声估计的误差导致语音失真。在利用听觉阈值计算谱减系数时提出了一种改进的计算方法,通过增加修改参数来抑制语音的过分衰减,减少了语音失真,然后
目的探讨及总结经导管动脉栓塞术(Transcatheter arterial embolization,TAE)治疗肝动脉假性动脉瘤(Hepatic artery pseudo aneurysm,HAPA)技术要点及栓塞材料选择,总结探讨
在我国公路工程的建设过程中实现工程监理制度,是我国对外开放进程加快、同国际之间的交往日益紧密和不断引进外来技术的重大成果。对公路工程进行工程监理,主要是对公路建设的