基于云计算的分布式推荐引擎算法研究

来源 :电子科技大学 | 被引量 : 15次 | 上传用户:chenqiang_11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的发展和互联网规模的壮大,必然导致用户信息接收量的几何增长,信息过载的时代已经来临。在这样一个时代里,我们每天接收着来自外界海量的信息,并不能够有效的选择和筛选。这种情况下,无论是信息的消费者还是信息的提供者,都遭遇到前所未有的挑战。消费者怎样从漫天的信息里寻找到自己所需要的信息,生产者如何让自己的信息被推送至需要它们的消费者那里,成为双方共同想解决的难题。推荐系统就是为了解决这样的困难而产生的:将用户同信息关联起来,通过分析用户的个人喜好,帮助用户筛选过滤信息,挑选那些可能会有用的信息呈现给用户。几乎所有的研究人员和推荐服务提供商,都在推荐算法的研究领域试图有所突破,因为这是推荐系统最核心的部分。本文首先研究了当前比较流行的一些算法,包括基于内容的推荐算法、基于邻域的推荐算法、数据降维方法、基于图的推荐算法等,这些算法都各自有其优缺点和不同的适用范围。基于物品的协同过滤算法是目前最受欢迎的推荐算法之一,它具有较高的预测准确度,并且具有解释的能力。Slope One算法作为一种简单、高效易实现的算法,是最近几年才被提出来的。本文借鉴基于物品的推荐算法中物品相似性度量的思想,对Slope One算法进行了改进,使用修正的余弦相似性对其进行加权。实验结果表明,我们的改进算法比传统的Slope One算法具有更高的预测准确度。融合技术近几年受到了研究人员的关注,它可以将单一的推荐算法按照一定的策略,融合为复杂的推荐算法,单一的推荐算法可能会互相弥补对方的不足,使得新的融合算法具有更好的普适性与预测性能。Netflix Prize冠军队伍获胜的算法便是采用了融合技术。本文受到融合技术的启发,在用修正的余弦相似性对SlopeOne算法进行加权之后,使用基于物品的协同过滤算法与之融合。通过实验,寻找到新的融合算法进行预测工作时候的最佳参数。比较了它与之前算法预测准确度,最后得出结论,新的融合算法综合了两种算法的优点,在两种评测指标上都表现出色,这是它所融合的两种算法都不能达到的。
其他文献
随着基于Intemet的分布式系统的不断发展,面向服务的计算(Service OrientedComputing)正逐渐成为构建基于Intemet应用的新的开发模式。服务(Service,如WebService或Grid Servic
随着信息时代的到来和Internet的发展,信息处理能力成为信息处理领域的瓶颈问题,不同语种之间大量的信息交流更加大了问题的严重性。不同语言之间的翻译工作越来越迫切,并且工作
随着教育机器人在教育教学实践中的推广和普及,面向教育的虚拟机器人研究受到的关注也越来越多,然而目前对虚拟教育机器人的研究多集中在图形化编程和物理仿真阶段,忽略了机器人
数据挖掘可视化技术包括数据挖掘技术与可视化技术,它首先来自于科学计算可视化。OLAM是数据挖掘(DM)与OLAP技术的有机结合,充分利用了二者的优势,克服二者的不足。本论文所
该文对无线传感器网络的最新进展进行了跟踪,对现有的数据扩散算法进行了详细的介绍和分析,设计了一套以数据为中心的网络应用系统的开发框架,并应用该框架完成了directed di
随着移动通信技术和GIS 技术的发展,人们生活水平的逐步提高,位置服务在国内逐渐兴起。由于国内电信运营商拥有无线网络设施、高精度定位系统以及多种增值业务系统,他们在发
随着网络使用的普及以及信息技术的不断进步,Web应用已逐渐成为一种主流的应用模式,如何确保Web应用的可靠性显得越来越重要。Web应用的特点是体系结构复杂、代码量大、页面众
当今,互联网飞速发展,网络新业务层见叠出,网络流量也呈现指数级的增长。网络业务流量的精细识别被广泛应用于规划和管理网络,解决网络用塞,预防网络攻击等方面,成为对防火墙等安全
从20世纪80年代中期开始,光纤通信在电信网中得到广泛的应用,凭借着廉价优良的带宽特性,光纤通信已成为电信网的主要传输手段。光同步数字传送网(SONET/SDH)主要以光纤为传输
在电信企业面向市场,面向国内外众多的竞争者,努力创造更高价值的同时,客户流失的不断增加,客户平均生命周期的不断缩减严重影响了电信企业的发展。如何才能减少客户的流失或