基于用户特性的CF算法在B2C类电子商务RE中的研究与应用

来源 :南华大学 | 被引量 : 5次 | 上传用户:jeffyi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据CNNIC一月份发布的《第29次中国互联网络发展状况统计报告》显示,截至2011年12月底,中国网民规模突破5亿,达到5.13亿,全年新增网民5580万。互联网普及率较上年底提升4个百分点,达到38.3%。分析显示电子商务类应用继续稳步发展,包括网络购物、网上支付、网上银行、旅行预订在内的电子商务类应用在2011年继续保持稳步发展态势,其中网络购物用户规模达到1.94亿人,较上年底增长20.8%,网上支付用户和网上银行全年用户也增长了21.6%和19.2%,目前用户规模分别为1.67亿和1.66亿。目前IT系统的存储能力远远不足,就更不用说深入地挖掘和分析了。但要想使用这些数据并不是一件很容易的事情。本文将以推荐系统的设计为例提出一种综合的解决方案。在应对大数据和实时性要求的同时各大IT公司纷纷提出自己的解决之道,其中不乏优秀的系统和编程模式,如:google的hadoop技术框架,nosql数据库和HDFS分布式存储技术,mapreduce编程模式,以及mahout等。本文就将依据这些新兴技术框架改造传统的推荐引擎使之可以满足大数据时代的实时性需求,提高推荐结果的命中率。本文在提高推荐引擎(RE)的推荐精准度方面提出了,在传统的相似用户算法的基础之上进行改进的基于用户特性的相似用户计算的方法。从而充分考虑了用户自身的社会特性,提高的推荐数据个性化需求。并利用lucene平台进行具体的实现,在此基础之上还提出来推荐引擎的整体设计架构图。并对每部分拆分进行讲解。最后针对具体的实施过程当中出现的技术难点和关键点提出了两个切实可行的解决方案。分别是“基于redis+zookeeper的主从备份及单点故障自动切换技术”和“基于dubbo+lucene改进的索引数据自动分发技术”。
其他文献
Internet已经成为当今和未来人们获取信息资源和进行信息交流的主要场所,然而要想在信息量浩如烟海的Internet上找到需要的信息,是一项极富挑战性的工作。目前,传统的信息搜索工
随着网络和多媒体技术的发展,流媒体应用开始越来越普及。为了适应流媒体应用对实时性的要求并有效地缓解网络带宽瓶颈,流媒体缓存技术应运而生。通过把流媒体缓存配置在客户
Kerberos是由麻省理工大学开发的一个基于对成密码技术和用户口令的,第三方的网络认证协议.该文在学习研究Kerberos协议,以及麻省理工大学和微软提供的Kerberos认证系统的实
近年来,随着电子商务、电子政务的发展,企业级应用的概念逐渐被软件开发人员和市场所接受。企业级应用的开发已经成为软件产业发展的主要动力。同时,企业级应用的快速发展给软件
基于组件对象模型(COM)的矢量图形编辑系统提供一个独立于其他具体应用系统的图形编辑环境,采用COM技术构建。按照组件化设计的思想,将系统各个大的功能模块作为一个独立的组
万维网地理信息系统(WebGIS)是Internet技术应用于传统地理信息系统(GIS)的产物,GIS通过WWW功能得以扩展,正在成为一种大众化的工具。但是,随着WWW技术的蓬勃发展,WebGIS的进一步发展
数据库管理系统可能会因一些不可预知的软硬件故障影响事务的正确执行甚至破坏数据库,降低它的可靠性和可用性。数据库系统的备份与恢复部分正是要解决这些问题。本课题以“
虚拟机实时迁移是虚拟化技术的一个重要特征,对于近年来不断兴起的数据中心的负载均衡和灾难恢复有非常重大的意义。通过虚拟机的实时迁移,把虚拟机从源物理主机硬件平台迁移
对图像分割算法的研究巳有几十年的历史,借助各种理论至今已提出了上千种各种类型的分割算法。由于尚无通用有效的分割理论,因此现已提出的分割算法大都是针对具体问题的,并
实时数据库是其事务和数据都可以具有定时限制的或显式的定时限制的数据库系统。系统的正确性不仅依赖于逻辑结果,而且还依赖于逻辑结果产生的时间。在实时数据库系统中集成