论文部分内容阅读
随着互联网技术的高速发展,数据开始呈指数式的增长,用户在海量的信息中越来越难找到自己所需要的信息。因此,如何在海量的数据中快速的找到自己所需要的信息,这将成为电子商务推荐系统的一个重要研究内容。本文从商品推荐系统的研究背景、研究意义和研究现状开始研究,对推荐系统中常用的算法以及所面临的问题进行深入研究。由于关联规则算法是电子商务推荐系统中应用较为成功的算法,所以本文采用了关联规则算法作为推荐系统的推荐算法。但在实际的运用情况下,传统关联规则挖掘算法存在支持度阈值设置单一、设置难和算法运行效率低下等问题。本文提出了针对FP-growth算法的改进方案,提出了基于多项目支持度树结构和支持度数组结合的关联规则挖掘算法,并且给出了改进关联规则算法的实现过程以及代码的具体实现。同时,本文还针对了单一的关联规则算法难以满足复杂推荐系统的应用,提出了结合数据分层和基于用户兴趣Top-N推荐策略的方法,有效解决数据“规则爆炸”的问题,从而提高推荐系统的运行效率。由于数据量大,对数据的处理需要较长的时间开销,传统的数据处理技术难以满足快速完成大规模的数据处理要求。因此,本文还使用Hadoop作为技术手段,实现高效的电子商务推荐系统。本文将商城的数据作为数据源,使用准确率和覆盖率评价标准来对系统进行测试,实验结果表明该推荐模型在推荐结果的准确性方面有明显的提高,并且保证每个商品种类的覆盖率均达到90%以上。最后,基于理论研究和实验测试,讨论了电子商务推荐系统的架构和实现方法,使用JavaEE的框架和B/S模式搭建推荐系统,系统包含后台管理系统和在线推荐系统两大模块,分别实现数据的处理与在线推荐的功能,从而验证了该推荐系统的可行性及应用性。