基于文本标签的个性化推荐算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:amao01010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展以及电子商务的快速流行,海量信息充斥在人们的生活中。信息超载问题也越来越严重。为了解决该问题,推荐系统就此诞生。它通过分析用户的历史行为记录,得出用户的兴趣爱好,进而从海量的信息中筛选出用户可能会感兴趣的内容。作为推荐系统中最关键的组件,推荐算法近年来受到了广泛的关注和研究。本文针对推荐算法中普遍存在的稀疏性、冷启动等问题,从数据源和推荐算法模型两个方面进行了研究。完成的主要工作有:  本文在深入分析现存的协同过滤推荐算法之后,提出将文本标签引入到推荐算法的构建过程中。经典的协同过滤推荐算法通常只使用评分数据训练推荐模型,推荐系统中除了评分数据之外还包含评论、标签等数据。鉴于文本标签和待推荐项目之间的强相关性,在给用户推荐项目时,合理利用这种关系可以增加计算的准确性。本文首先从用户历史行为记录中提取所有的文本标签,构建标签空间;然后根据各项目与这些标签的隶属关系,得到各项目在标签空间中的向量表示;最后借助深度学习方法提取各项目的标签特征,使用所有项目的标签向量作为输入,训练一个单隐藏层的自动编码器神经网络。  本文的另一项工作是,深入研究矩阵分解模型和邻域模型的运行原理,提出了一种基于文本标签的矩阵分解推荐算法。邻域模型的工作原理决定了其能更好地捕获局部信息,而矩阵分解模型通过在已知评分集合上建模用户和项目的潜在特征向量,达到更好捕获全局信息的目的。两种模型本质上是互补的,本文用一种适当的集成框架将二者的特性融合起来,依据预先从文本标签中提取的各项目的标签特征,确定目标项目的近邻集合,使用该集合中项目的标签特征扩展评分预测模型中的项目向量。实验结果表明,相较于传统的协同过滤算法,本文算法的推荐结果准确率更高。
其他文献
客观世界,既是物质的世界又是信息的世界。它既包含大量的已知信息,也包含大量的未知信息与非确知信息。未知的或非确知的信息称为黑色信息;已知信息称为白色信息。既含有已知信
网络虚拟化为解决传统网络结构的僵化问题提供了新的思路,其关键问题是如何将虚拟网络映射至物理网络。满足节点和链路约束条件的虚拟网络最优映射问题主要采用粒子群算法和遗
随着移动网络使用率逐日增加,移动App正为用户提供着越来越精确的服务。用户在使用这些位置服务的同时,其位置隐私也会暴露。位置隐私的泄露,会影响甚至危害到用户的正常生活。
遗传算法是一种借鉴生物界自然选择和进化机制发展起来的高度并行、随机、自适应搜索算法。它的研究历史比较短,早期是一种试图解释自然系统中生物的复杂适应过程入手,模拟生物
随着信息时代的到来,计算机技术开始飞速发展,软件产品在人们生活中的应用日渐普及,软件已经成为日常生活和经济发展中不能缺少的部分。在软件产品给人类生活带来便捷的同时,
学位
智能制造业的快速发展,对节点间通信的实时性、可靠性以及通信带宽提出了更高的要求。作为智能制造业最基础的核心技术之一,工业现场通信技术始终处于高速发展中,近些年涌现出一
随着移动设备和无线局域网的普及,定位服务越来越成为人们生活中必不可少的功能。相比于目前已经很成熟的户外GPS地图定位,室内位置信息的获取,特别是在场地复杂的公共场所比
时间序列是一种广泛存在的数据,客观记录了所观测的系统在各个时刻点的具体值,所以可以通过研究时间序列数据来辨识和重构所观测系统的动力学行为。早期的研究方法是基于统计
随着我国证券市场的不断发展和完善,股票市场作为我国经济“晴雨表”的功能也越来越突出,无论是个人投资者还是国家都十分关注股票市场的走势。若能较为准确的预测股票市场的涨跌趋势,不仅可以为广大投资者提供投资决策的依据,也能够为国家制定相关经济政策提供参考。股票市场具有非线性、高噪声、数据量大等特征,相关的股票分析方法,如基本面分析法、技术面分析法、时间序列分析法等,各有特色,但难以适应日趋复杂的股市。研