基于云计算的推荐系统的研究与设计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:CHENGXB
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来互联网发展速度一日千里,变化日新月异。电脑、手机的迅速普及和功能的强劲使得人们在足不出户的情况下就能通过互联网了解国内外资讯、查看新闻、关注娱乐时尚、获取理财建议、观看幽默笑话、购买商品等等,带来了极大的便利。与此同时,数据量也呈爆炸式增长,每天在互联网上产生的数据数量已经达到了PB级。在海量的信息面前,用户主动去查找自己喜欢的内容、快捷地筛选对自己有用的信息变得极为困难。针对这些问题,推荐系统诞生了,它可以通过记录用户日常上网的行为数据,分析出不同用户的不同喜好,从而有针对性地进行个性化推荐。要实现这样的推荐系统,需要进行两个方面的研究。一是需要有好的推荐算法,提高推荐的准确性;二是需要能够快速地处理数据,降低算法的运行时间。目前,协同过滤算法在工程中应用广泛,除了算法本身还需要进行优化以外,大数据时代下对算法的效率也提出了要求。协同过滤算法中的相似度计算方法有很多种,而实际使用时只是选择其中一种进行计算,不能很好的覆盖用户喜好的多样性,也使得算法的准确率大打折扣。同时,目前大多数研究的重点都在关注推荐系统的准确度,而忽略了其他的一些指标。因此,如何完整地评价推荐系统也需要进行研究。本文使用Hadoop云计算平台,先深入研究Hadoop云计算平台中的技术,再研究了协同过滤推荐算法的UserCF和ItemCF,提出了组合相似度计算方法的思想。把推荐算法部署到Hadoop云计算平台上,实现算法的并行化计算,提高算法效率。建立推荐系统的评价体系,运用查准率、查全率、MAE以及加速比来评价推荐系统的整体性能。最后文章中做了两个实验,使用基于云计算的ItemCF实现一个电影推荐系统,通过输入互联网上的用户评分数据集观察结果,分析其性能。接着在职位推荐系统中,同时使用多种推荐算法相比较,找出相对优秀的两种相似度计算方法,将它们进行组合,并在实验中找到理想的组合方式。同时证明云计算平台的高性能,与推荐算法结合达到了预期的效果。本文中基于云计算的推荐系统,通过组合算法,提高了推荐结果的准确度;通过使用Hadoop云计算平台,提高了推荐系统的性能,这些对实际工程都有着重要意义。
其他文献
随着无线通信技术的发展,业务类型和传输数据量急剧增加,使得有限的频谱资源变得更加紧张。在无线IP网络中,对数据包报头进行压缩可以提高频谱资源的利用率,其报头压缩效率可
给水加热器的作用是通过冷热介质的换热来提升凝结水的温度,减少了凝汽式汽轮机直接排往凝汽器而实际仍有潜能的蒸汽量,提高了热力系统的换热效率。给水加热器是根据等焓分配
随着未来网络的快速发展,将会产生一个全新并具创新性的服务市场,将会给用户提供一种全新的服务体验,更好的支撑上层的应用和服务是未来网络的主要目标。而目前,科研人员缺乏
近年来,Android智能手机发展十分迅速,但是Android系统的开源性以及应用商城对新发布软件检查力度的薄弱,导致Android平台上的恶意软件日渐增长,单纯依靠病毒分析人员手工处
当今社会,产品质量安全问题日益受到重视,多方面保证产品质量安全刻不容缓。为了更好提高产品质量安全,保证消费者合法权益,本课题在对产品生产过程进行追溯的基础上,联合国
随着移动通信技术和智能终端的快速发展,移动互联网已经深入人们生活的方方面面,智能手机作为接入互联网的工具,不仅为我们提供了通信服务,而且改变了我们的生活方式,如娱乐
外观设计以产品外形或包装的最终形态出现在市场经济中,对各种市场主体产生了直接的影响,因而对市场经济的重要性不言而喻。伴随着经济的飞速发展,传统大陆和英美法系在专利
随着近年通信技术和互联网技术的不断发展,数据流的价值越来越受到重视,其中隐含着很多有价值且有时效性的信息,而获取这种信息的手段就是数据挖掘技术。关联规则挖掘技术作
民主是政治生活永恒的追求,经过不断的实践和检验,我国已经形成了具有中国特色社会主义的协商民主理论。党的十八大以来,习近平总书记高度重视协商民主的建设和发展,鼓励大家从协商民主的角度去研究我国政治建设的发展。我国的广大农村地区,村民自治是我国农村基层民主建设的核心问题。随着我国经济社会的不断发展,社会利益主体日益多元化,为了满足个人的利益需求,他们往往会在基层民主建设中突出表现自身的利益,不利于公共
目前虚拟现实是受关注最多的高新技术之一,而分布式仿真一直是虚拟现实领域的研究热点。随着虚拟现实系统的规模不断扩大和逼真度要求逐步提高,将分布式仿真技术、视景仿真技