基于用户评论的图书推荐算法研究

来源 :河北师范大学 | 被引量 : 0次 | 上传用户:oicui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展,尤其是Web 2.0的兴起,为人们提供了丰富大量的信息资源,人们在畅游信息海洋的同时,“信息过载”给人们带来的困惑也越来越多。面对大量的信息,人们往往无从选择,想要寻找自己需要的信息必须花费大量的时间和精力。推荐系统应运而生,很好的解决了信息过载问题,并在电子商务平台得到广泛应用且成为重要组成部分。目前,在众多的推荐技术中,协同过滤是应用最广泛的推荐技术,尤其是在电子商务平台,其应用效果表现的更为突出。在传统的协同过滤推荐系统中,推荐结果的产生是利用用户的评分来完成的。这种方法存在的问题是:一方面,随着用户数和项目数的增加,用户—项目评分矩阵的数据严重稀疏;另一方面,用户的评分反映了用户对所购产品的整体喜好,但用户对产品的某一特征或属性的偏好从整体评分上并不能够得到体现。为了能够充分了解到用户对产品不同特征层面的偏好,大量研究者们通过对用户评论进行特征—情感词对抽取来获取用户偏好,从而为用户提供更准确的推荐。本文针对图书推荐算法,主要从以下几个方面进行了深入的研究和探讨。首先,对用户评论语料进行预处理,抽取出特征—情感词对,量化产品在不同特征层面的分数,构建项目-特征评分矩阵,在此基础上获得用户在项目特征层面的偏好。其次,在进行项目相似度评分预测时,提出利用基于项目的评分相似度和特征相似度的综合相似度来预测评分,填充评分矩阵,解决数据稀疏性问题。然后,针对传统的基于用户的协同过滤算法在用户相似度计算时,只是考虑用户评分上的相似而未考虑用户偏好相似的问题,提出在用户相似度计算时加入偏好相似度计算的方法。最后,使用来自Stanford SNAP的公共图书数据集,通过实验验证本文提出的算法的有效性。实验结果表明,我们的方法与传统的算法相比,达到了良好的推荐效果。
其他文献
近年来,大量和潜在无限的数据流是由实时监视系统、通信网络、Internet传输信息、网页点击流、金融市场的联机事务处理和其他动态环境产生的。与传统的数据集不同,数据流是按
由于XML具有良好的数据格式、可扩展性、高度结构化、便于网络传输等特性,这些决定了它是一项卓越的应用广泛的技术。本论文以网络考试系统为应用对象,对XML及相应技术进行了
软件即服务(Software as a Service,SaaS)以网络为载体、以云计算为依托为用户提供软件租赁服务,具有价格低廉、部署迅速和配置灵活的特点,是未来软件业发展的重要方向。由于
随着计算机技术和电子通讯技术的快速发展,嵌入式系统的应用日益广泛,嵌入式产品已经进入到人们的日常生活中,并将有更广阔的发展前景。ARM作为嵌入式系统的主流微处理器,在
随着信息技术的快速发展,管理者在进行决策分析和制定时不能单纯依靠以往的经验,必须借助必要的数据来进行科学的管理。这导致管理人员进行决策分析时对数据的依赖性更加强烈
随着网络的快速发展和网络上各种信息的激增,为了获得理想的有价值的信息,检索技术受到人们越来越广泛的关注。信息检索系统作为网络的一个重要组成部分,在满足用户信息需要
随着我国经济的发展,城市的规模正在逐渐扩大,机动车的数量也迅速增长。在这繁荣景象的背后,有着各种各样的问题。交通堵塞,尾气污染正在严重影响着城市居民的日常生活,每年
在智能监控领域,复杂背景下的人体跟踪是一项具有挑战性的工作。各种不利因素,如杂乱的背景、光照的改变以及遮挡,都极大影响人体跟踪的准确性和鲁棒性。本文提出在跟踪过程
信息化时代,企业的信息管理程度不断深入,水平也日益提高,这大大冲击了传统的制造业,让传统的制造业摒弃了许多以前陈旧的管理理念。此外,通过信息化技术降低了企业的运作成
随着科技的迅猛发展,数字化时代的迈进,混合式学习越来越受到教育界和工业界的瞩目。交互式电子白板凭借其丰富的学习资源,方便快捷的操作步骤,多姿多彩的教学方式和安全环保