论文部分内容阅读
Web的发展带来了信息爆炸问题,在这种情况下能够提供个性化信息服务的推荐系统已经越来越受欢迎,而且显得必不可少。由于其重要的商业价值和研究价值,推荐系统在工业界和学术界得到了广泛地应用和深入地研究。典型的推荐系统是基于协同过滤的。这种技术能够根据相似用户(或相似item)的评分来预测当前用户的兴趣。本论文的研究目的是推进基于协同过滤的个性化Web推荐技术的发展。本文首先面向个性化产品推荐,提出了协同过滤的一种新相似度算法。相似度算法用来度量两个用户(或两个item)的相似程度,它对于协同过滤来说十分关键。传统的相似度算法性能有待提高,本文提出的新相似度算法(名为JacUOD)比传统算法更有效。JacUOD对于在同维数空间里的向量有效,对于在不同维数空间里的向量依然有效。与传统算法相比,JacUOD不但考虑了向量长度,而且妥善地处理了不同向量空间的维数差异。基于公开的电影数据集MovieLens所做实验的结果表明,JacUOD的性能优于传统算法。随着互联网上的Web服务越来越多,Web服务的个性化选择和推荐变得越来越重要。因此,本文针对个性化Web服务推荐,提出了一种新的协同过滤方法——归一还原协同过滤。为了评价归一还原协同过滤对于Web服务个性化推荐的性能影响,我们做了大规模实验,实验涉及分布在全球73个国家5,825个Web服务和处在全世界30个国家的339个用户。从目前掌握的情况看,我们所做的实验是服务计算领域规模最大的实验,规模比原有的记录提高了一个数量级。实验结果表明,归一还原协同过滤方法比其它方法具有更好的精度。最后,面向云环境下的个性化开放接口(Open API)推荐,本文提出了名为HUCUI的用户聚类协同过滤方法。近些年,互联网上出现了越来越多的开放接口供独立的第三方用户调用以开发新的应用。随着云计算的发展,云环境中开放接口的数量在不断增长。云环境下功能等价的开放接口也越来越多,基于非功能属性(QoS)的开放接口推荐也变得越来越重要。为实现云环境下个性化开放接口推荐,本文设计了用户聚类协同过滤方法HUCUI。这种方法受这样的灵感启发:度量开放接口的相似度应该基于偏好相似的用户。它先根据用户的偏好把用户划分到某个用户组,然后在用户组内进行基于item的协同过滤。由于多个用户组之间可并行执行,它具有很好的可扩展性。除此之外,它也具有良好的预测精度。基于真实接口QoS数据集的实验证明了这种方法的有效性。