论文部分内容阅读
随着网络技术与信息服务的快速发展,社交网络、电子商务网站等互联网服务的应用愈加成熟。个性化推荐作为一种关键性技术支持因素,在社交性和商务性的互联网服务中具有重要地位。协同过滤推荐算法以优秀数据建模技术及服务智能化的特点,广泛应用于个性化推荐的研究中,起到了加速个性化推荐发展的特殊作用。然而,在个性化推荐中极度稀疏的数据条件下,协同过滤存在着相似性度量不准确、推荐精度低的问题和不足。针对这些问题,本文对个性化推荐协同过滤算法进行研究,主要工作如下:1)针对协同过滤中常用相似性度量方法不准确问题,建立基于用户评分行为的相似性模型(User Rating Behavior based Similarity Model,简称为URBSM)。URBSM在用户行为层面把握用户评分行为规律和整体数据环境变化,从用户评分行为异同性出发,将非线性函数S型函数引入度量模型。同时,考虑整体用户评分重叠以及用户评分习惯,利用Jaccard相似性系数和均方差相似性MSD对相似性进行双重加权,达到增强用户兴趣差异的作用和效果。2)针对协同过滤评分预测中近邻评分数据不足所导致的推荐准确性下降问题,建立灰色评分预测模型(Grey Rating Prediction Model,简称为GRPM)。结合数据固有的“贫信息”、“小样本”特点,利用灰色理论相关知识,将灰色预测与协同过滤技术融合,建立灰色评分预测机制。通过评分序列预处理来缓解近邻数据稀少所带来的评分预测数据基础不足问题,提出利用项目评分均值填充有空缺的初始评分序列。灰色预测中根据相似度大小形成递增评分序列,提出利用项目所有评分均值来填充有空缺的初始评分序列,以更贴近现实情况,再通过序列累加处理加强相似性大的用户评分分值对预测评分的影响和作用。3)进行对比实验,从不同近邻规模、不同推荐列表和不同数据稀疏水平三个角度,将URBSM与协同过滤现存相似性度量方法进行对比、GRPM与协同过滤传统评分预测进行比较,以验证其有效性。最后,将URBSM与GRPM相结合形成改进的协同过滤(Improved Collaborative Filtering,简称为ICF),与传统协同过滤、基于概率模型的协同过滤PM-CF及奇异值分解SVD协同过滤进行对比实验,以分析改进协同过滤的推荐效果。