基于聚类和深度神经网络的推荐模型研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:c42865
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统已被广泛应用于许多领域,如购物、新闻、影视等,其核心算法的性能直接影响推荐的质量。以往模型多采用相似度、标签、规则、群体智能或者物理学等方法。随着用户与物品数量的持续增加,在规模大、高稀疏数据条件下,传统方法效果不佳。虽然深度学习技术给构建新型推荐模型提供了新思路,但仍存在两类问题:(1)聚类过程中一个样本只能属于一个分组,并且没有考虑它们之间的相似性联系,缺乏足够的约束条件使得结果具有不准确性;(2)深度学习方法在内容方面有着极佳的表现,如文档、网页等,在非内容领域性能不足。为此,论文工作将研究解决上述问题的方法并提出新的基于聚类和深度神经网络的推荐模型。论文主要工作和创新点如下:  提出了一种基于图的聚类推荐模型,它首先利用矩阵分解来发掘用户的兴趣和物品的特征,然后计算它们的相似度并构建无向图来求解最终的分组。通过加入相似性限制图的自由度,使得聚类结果更加可靠;另一方面,用户可能具有多种不同类型的兴趣,而物品也具备多种特征,因此,提出的模型允许它们同时属于多个分组,也更符合现实情况。通过在三种较为权威的公开数据集上(MovieLens-100K、MovieLens-1M和Epinions)进行实验,在MAE指标上与现有的方法最好结果相比分别提升了约5.15%、5.14%和4.42%的预测精度,在NDCG指标上分别提升了约3.94%、4.1%、1.60%的推荐精度,验证了新模型的有效性;  提出了一种基于二次多项式回归的深度推荐模型,它主要根据交互行为如浏览、评分等产生推荐结果,多用于购物等非内容领域。首先,使用二次回归模型获得用户、物品的特征以及它们的潜在关联,丰富输入层的特征表示,然后利用深度神经网络来学习有关参数,去拟合用户行为,预测他们对特定物品的喜好。通过在上述三个数据集上进行实验,在MAE指标上与现有的方法最好结果相比分别提升了约2.2%、1.7%和3.0%的预测精度,在RMSE指标上分别提升了约1.6%、1.2%、1.5%的预测精度。
其他文献
近年来随着多媒体技术和互联网的飞速发展,图像信息越来越得到重视。如何从大量的图像中快速、有效、准确地搜索到人们感兴趣的图像成为当前面临的重要问题,基于内容的图像检
基于视觉的运动分析是为了使计算机获得智能感知能力,使它们能够从视频里面识别物体,理解目标的行为。随着各种各样的视频数据大量涌现,计算机视觉的应用范围也越来越广,比如视觉
随着煤矿资源的日益短缺和对煤矿工作人员人身安全的越来越重视,煤矿安全的重要性越来越突出,矿山应急救援更加重要。在煤矿发生紧急事故时,如何选择最佳的避灾路线,使损失降
故障管理作为网络管理的核心功能之一,可以保证网络的可用性和可靠性,并且在一定程度上预防故障的发生。随着网络应用和网络规模的增加,及时准确发现网络中的故障变得越来越
近年来,随着战场环境仿真技术的提高,逼真的虚拟战场环境实时仿真成为作战仿真的基础。三维地形场景是虚拟战场的重要组成部分,而海量的地形数据在精度和广度上不断深化,如何
本文首先介绍了计算机考试系统的开发背景、技术支持、结构化开发的现状,然后选用ASP语言和ACCESS2000数据库开发了一套计算机考试题库管理系统。计算机考试题库管理系统是对
复杂网络是对现实世界中存在的大型复杂系统的高度抽象,具有不同于传统研究领域常见的规则网络和随机网络的统计特征,其中比较有代表性的有小世界效应,无标度特性,聚集性,网络传递
在Web服务技术中,UDDI注册中心为Web服务的发布和发现提供了一个公共平台。目前,越来越多的企业采用Web服务的方式进行企业业务集成,为此建立起了相应的UDDI注册中心,但是这
基于IPv4/IPv6双协议的网络传输平台是未来互联网发展的必经阶段,双栈协议模式下的服务器流量监测技术是网络安全技术基础之一,也是未来IPv6协议平台上主机安全技术的主要基
本系统是经过对现在网上销售市场进行实际情况调查,可行性分析、业务流程分析后设计的。   本系统除了通常网店具有的买卖功能外,另一特点在于可以为设计师提供在家工作的机