论文部分内容阅读
目前电子商务推荐系统较多的采用协同过滤的技术为用户提供推荐商品。但是协同过滤的方法存在如下的不足,即:需要根据用户兴趣信息或评价信息才能为用户作出推荐,因此对于用户规模较小的网站无法用该方式给出推荐结果。于是本文转换研究视角,侧重挖掘商品与商品之间的相互关系,试图在不考虑具体用户的前提下,利用商品之间的内在联系为商品浏览者提供相关推荐。就本文来说,我们以书籍商品作为研究对象,利用书籍与书籍之间内容上的联系性,为书籍作出相关推荐。当用户查询购买或者浏览书籍时,其他书籍会因与查询或浏览的书籍内容相关而得到推荐,以方便用户。本文的研究内容主要包括以下四个部分:第一,根据电子商务网站书籍推荐系统不可能提供全部书籍内容的特点,本文提出了一种基于书籍属性相似的推荐方法:利用网络上常见的描述书籍内容的属性字段,结合文本相似性的度量方法,给出了本文第一种基于内容的书籍推荐策略。这种推荐方法得到的推荐书籍一般与原书籍内容相似,从而可以让用户在更多的候选中选择适合自己阅读水平的书籍;第二,针对有些用户更倾向于关注内容相关而非内容相似的书籍的问题,本文提出了一种基于词语相关度度量书籍文档相关性的计算方法,并用此方法给出书籍推荐结果。这种推荐策略侧重推荐与原书籍内容相关的书籍,从而可以让用户查询或浏览目标书籍时获得更多相关书籍的信息;第三,针对推荐系统中常见的由于数据量大而导致推荐速度较慢问题,本文利用聚类分析技术先将书籍文档分成小的类簇,再在类簇中进行书籍推荐的方法以降低算法复杂性;第四,通过本文提出的相关书籍推荐方法,本文实现了一个在线的书籍推荐系统。该推荐系统将作为本实验室研发的海天园知识服务平台的独立模块服务于互联网用户。当用户输入书籍查询请求时,系统首先给出查询的检索结果然后分别给出与检索结果相关的推荐书籍。