协同过滤系统中稀疏性问题研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:snwkq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,互联网的应用也在快速普及,并受到了公众的认可和赞同。同时,互联网也渗透到我们每个人的生活中,网上交易购物,也变得越来越流行。由于互联网信息的种类繁多,商品数量庞大,如何在众多商品中正确的选择商品和购买到自己需要的商品成为用户要面临的一个问题。为了帮助用户在互联网上更好地选择商品,推荐系统应运而生_。推荐系统是用来帮助用户选择商品和产生商品智能推荐的系统。其中最重要的推荐技术是协同过滤技术,协同过滤技术利用用户品味间的相似来产生推荐。   目前,协同过滤技术在研究和应用领域上均取得了很大成功,但还存在诸如稀疏性(sparsity)、冷启动(cold-start)、可扩展性(scalability)等制约其进一步发展的瓶颈问题。因此,需要对上述协同过滤瓶颈问题展开进一步研究。   在用户模型层面,论文分析了目前的协同过滤推荐中经典用户模型存在的缺陷,利用项目组合特征和人口统计信息构建了混合用户模型。混合用户模型浓缩了项目内容描述信息、用户人口统计信息和用户-项目评分矩阵,提高了用户模型的信息浓度,在一定程度上解决了稀疏性和冷开始问题。   在协同过滤算法层面,论文分析了当前电子商务个性化推荐系统中常用的协同过滤推荐算法存在的稀疏性、可扩展性、实时性和推荐准确度等问题,提出了基于混合用户模型的协同过滤推荐算法。在深入分析常见的推荐算法的基础上,将SVD模型与基于内存的K最近邻算法相结合(SVD-KNN)。在数据稀疏的情况下,该算法可以提高推荐系统的预测精确率。   采用MovieLens数据集对论文提出的改进算法进行了仿真实验。实验结果表明:基于混合用户模型的SVD协同过滤推荐算法在推荐的准确性、完整性、可扩展性等方面均优于实验对比算法。
其他文献
随着信息技术的飞速发展,移动通讯与互联网融合发展的趋势日趋明显,作为电子商务领域的新生力量,移动商务显示出巨大的发展潜力和成长空间。移动购物就是其中一个典型的例子
Ad Hoc网络是一种分布式的网络,具有无中心,自组织,多跳,网络拓扑结构动态变化等特点。由于Ad Hoc网络的独特特点,使得传统的有线路由协议和基于基站的无线路由协议不适用于A
数据分类技术作为数据挖掘中的核心和基础技术之一,它的许多分类方法已经由机器学习、模式识别和统计学方面的研究者提出。作为软计算分类算法中的一员,人工免疫系统中的负选
脑血管疾病严重威胁着中老年群体的健康,随着年龄的增长,脑血管疾病的发生几率急剧上升。脑血管疾病的治疗需要花费大量金钱而治疗效果却往往不令人满意,不仅严重影响病人及
计算机网络的普及应用,丰富了人们的日常生活,然而,网络上的信息可以方便的复制和修改,使得版权保护成为一种迫切需要解决的问题。在地理信息系统(Geographic Information Sy
点云模型的数字几何处理已在计算机图形领域受到广泛的重视。基于点的图形学的研究在工业制造、考古及文物保护、医学和娱乐产业等诸多领域得到了广泛应用。   本文主要进
水下无线传感器网络(Underwater Wireless Sensor Network,UWSN)可用于海洋学数据收集、污染监测、近海探测、灾难防御以及协助海军进行战术跟踪等领域。与其他水下探测工具
中文分词及词性标注不仅是自然语言理解领域的难点问题,也是中文数学智能教学系统中的基础性问题。提高自动分词及词性标注的准确率,修正分词及词性标注的结果,能为实现小学
车牌识别是现代智能交通系统中的重要组成部分,它以数字图像处理、模式识别、计算机视觉等技术为基础,对摄像机所拍摄的车辆图像或者视频序列进行分析,得到每一辆汽车唯一的
传统的数据挖掘解决了海量数据贫乏知识的情况,但是传统的数据挖掘只适合于准确的数据,它没有考虑到数据的不确定性,然而不确定性是客观事物本身所固有的一种特性,数据挖掘如