论文部分内容阅读
在信息过载的今天,人们可以通过互联网拥有各式各样的获取信息的途径与方式,但最需要人们花费时间的是要在庞大的信息海洋中发现自己感兴趣的信息。推荐系统就在这种条件下应运而生。对用户而言,推荐系统能帮助决策,发现新鲜事物。对商家而言,推荐系统能提供个性化服务,提高信任度和粘性,增加营收。传统的推荐算法一般都是通过分析用户对物品的评分数据,之后再进行偏好推荐。然而如果用户对项目的行为信息过少,使得评分数据过于稀疏,推荐系统的推荐效果会变差。为了预测填补评分数据中的空缺信息,研究者提出了评分预测算法。评分预测算法通过研究项目的属性,构建模型来对预测并补全用户项目评分矩阵中的空缺项。常见的评分预测模型包括平均值法,矩阵分解模型等。但这些方法都存在深层特征提取困难,数据处理方式单一等问题,这些问题会导致预测精度低以及结果不够合理。深度学习中的模型具有较强的适应性,在很多领域都被广泛使用。相对于嵌入方法而言,深度学习的模型对数据之间的联系分析得更加充分,从数据中学习到的特征也更具代表性,从而可以间接地提高预测精度。针对上述问题,本文对基于特征嵌入的推荐算法(FE)进行改进,利用深度学习中的卷积神经网络与长短文本记忆模型来处理项目名这一文本特征,提取项目名属性的深层信息并处理成特征向量,其他属性通过嵌入方法处理成向量形式,之后分别将用户及项目的各个特征向量进行叠加获取得到用户特征矩阵和项目特征矩阵,最终通过两者的特征矩阵相乘得到预测评分。本文具体研究工作由以下三部分组成:第一,通过阅读文献,对传统的推荐算法,与深度学习相关的模型及嵌入模型的研究现状进行深入了解,分析各个算法的优缺点,并阐述了几种基于深度学习的推荐算法。第二,针对嵌入方法对特征提取不充分、评分预测精度低及数据集中数据稀疏性问题,本文在基于特征嵌入的推荐算法中引入卷积神经网络,提出基于卷积神经网络与特征嵌入结合的推荐算法(Feature Embedding-Convolutional Neural Network,FE-CNN)。模型通过嵌入方法处理用户项目标签特征叠加后获得用户及项目特征矩阵,其中根据项目名这一文本信息的特性,融合卷积神经网络来处理项目名中的文本信息,实现更充分地挖掘特征这一目标。利用模型处理后的用户项目特征矩阵相乘得到预测评分。实验结果证实了算法FE-CNN在MovieLens上的两组数据集上相较对比算法有更低的预测误差。第三,针对FE-CNN模型中卷积神经网络提取特征可能会出现长距离依赖的问题,对FE模型进一步改进,使用长短文本记忆模型来处理项目名信息,提出了基于长短文本记忆模型与特征嵌入的推荐算法(Feature Embedding-Long Short Team Memory,FE-LSTM)。算法利用LSTM模型来处理项目名特征,其他属性通过嵌入模型进行处理,构建用户和电影的特征矩阵,最终通过二者特征矩阵相乘得到预测评分。通过实验验证FE-LSTM算法在预测结果的MAE值与RMSE值更低,说明FE-LSTM算法在预测评分时有更低的预测误差,同时能一定程度上缓解数据稀疏性问题。