论文部分内容阅读
个性化推荐的基本任务是利用已知评分来预测未知评分进而进行推荐,概率矩阵分解模型是其典型代表,但仍存在着诸如高维稀疏性等制约其进一步发展的瓶颈问题。本文在深入研究概率矩阵分解模型的基础上提出相应的改进算法,论文的主要贡献如下:(1)在对协同过滤、概率矩阵分解和信任机制的国内外研究现状进行阐述的基础上,深入研究和分析了概率矩阵分解技术的基本原理和基于社交网络的信任机制,同时根据项目和数据分析的需求成功搭建了用于处理大数据的HBase存储系统和Spark集群。(2)针对概率矩阵分解对初始值敏感的问题,融合用户项目偏置信息提出一种基于交替最小二乘的改进算法。将分解得到的潜在因子作为交替最小二乘的初始值以提升推荐精度。实验结果表明,本文提出的算法在推荐精度上提升显著。(3)在用户项目偏置信息的基础上,基于信任传播机制提出一种社交网络的改进算法,将信任与评分相结合,共同评价用户之间的偏好关系,通过梯度下降来获取最优解,实验结果验证了改进算法的有效性。将本文中提出的改进概率矩阵分解技术应用到实际项目中,设计并实现了推荐的原型系统,达到了项目在个性化推荐方面的预期要求。