基于主动学习的个性化推荐算法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:kxf2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,互联网日益成为人们生活必不可少的东西,人们借助互联网可以完成新闻浏览、网上购物、观看影片、分享信息等操作,这拉近了人们之间的距离。正由于其迅速发展,冗余信息、无用信息越来越多,随之带来的是信息过载问题。为了解决信息过载问题,各领域专家提出了分类目录,搜索系统等诸多技术,目前推荐系统也成为解决信息过载的主流技术之一。推荐系统的目标是挖掘用户潜在的兴趣,帮助用户完成信息过滤。本文研究了基于主动学习的推荐系统,利用主动学习能够主动选择合适的训练集,加快建立准确模型的速度的特点,解决冷启动中的新用户问题。通过在公开数据集MovieLens和MovieRating上进行实验,验证了本文提出的算法确实可以缓解新用户问题。本文的主要工作和贡献有:1)本文分析研究了目前主流的推荐算法和主动学习算法,在推荐算法上,重点研究了基于矩阵分解的Baseline SVD算法,并通过实验比较,验证了其确实优于其他算法。2)本文分析了推荐系统目前存在的难点和重点,针对冷启动的新用户问题,提出了一种基于震荡系数作为主动学习样例选择的策略,Baseline SVD作为基准学习器的方法。通过与随机选择策略和流行选择策略进行比较,证明了本文提出的算法确实有利于对新用户加快启动推荐。3)基于震荡系数的算法是基于改变浮动较大的样本具有更高价值的假设,然而震荡系数受到很多因素的影响,例如模型本身的不准确性。本文提出了另一种基于误差估计的样例选择策略,并将其与基于震荡系数的方案进行比较。实验证明,基于误差估计的主动学习策略在效果上更优。结合两种样例选择策略,对其做一个加权集成,得到一种更优的选择策略。4)针对数据稀疏性问题,本文提出了一种混合推荐算法,通过结合Slope One算法与Baseline SVD算法得到一种新的推荐算法,将该算法与其他推荐算法作比较。实验证明,能有效提升推荐准确度。
其他文献
目前大部分搜索引擎采用关键词匹配技术,即相同的查询关键词将返回相同的查询结果。而实际上,对于同一个查询词,不同的用户其查询意图可能不同,同一个用户在不同时期其查询意
中国电信作为国内最大的互联网接入商,在激烈竞争的市场环境下充分利用自身的平台优势形成核心竞争力,提高可持续发展的能力,并扩大电信品牌在老百姓生活中影响力是企业成功
随着传感技术、通信技术和计算机技术的飞速发展以及微型机电系统的日益成熟与完善,无线传感器网络已广泛应用到许多领域。然而,大多数无线传感器的应用受到能量有限性的限制
网络与通信技术的迅速发展给人们的工作和生活方式带来了巨大的改变。在更大、更快、更安全、更方便且融合有线传输和无线传输于一体的下一代互联网NGI(Next Generation Inte
以网络技术为纽带快速、商效、方便地传递知识的网络教育使得教育能够跨越时空的限制,使任何人,在任何时间、任何地点,从任何章节开始、学习任何课程,充分体现了主动学习的特点,能
移动Ad Hoc网络作为一种无线对等自组织网络,具有组网容易、节点可自主移动等特点。这样的特点却同时是一个双刃剑。无线网络本身的特点以及移动Ad Hoc网络中网络拓扑的动态
随着传感器技术、无线通信技术和计算机技术的飞速发展以及微型机电系统的日益成熟与完善,无线传感器网络技术已经在许多应用领域获得了越来越广泛和深入的应用。然而,大多数
为了用户分析火箭助推器的结构与性能,方便绘制火箭助推器三维图形以及弹道轨迹仿真,且实现关于火箭助推器产品和数据的管理,研究并开发出一个功能全面的火箭助推发射系统。
20世纪90年代末兴起的光纤通道(FC)标准兼有高速网络通信和I/O通道控制的优势,支持多种可选的传输介质、传输速率、拓扑结构和高层通信协议,如今已发展成为嵌入式高速网络通信领
数字水印技术是一门新兴的数字产品版权保护安全技术,经过近年来的迅猛发展,已经成为安全领域的一个研究热点,在版权保护和信息隐藏领域有着广阔的应用前景。  基于变换域