一种基于联合聚类的协同过滤推荐算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:netwanderchf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网中信息量的急剧增长,人们在海量信息中快速获得自己感兴趣的信息变得越来越困难。如电子商务、社交媒体、音乐、视频、问答等站点,信息量越来越庞大,而用户所关心与关注的往往是很少的一部分。个性化技术强调从用户兴趣出发,针对不同用户提供特定的个性化服务。其中,推荐系统根据用户历史信息发现用户的兴趣,从而主动向用户推荐其可能感兴趣的资源,帮助用户快速获取有用信息。协同过滤技术是一种基于用户显性评分行为的推荐技术,是应用最早且最为成功的推荐技术之一。然而,随着系统中用户数量与项目数量的与日俱增,其面临着两个主要挑战:(1)提高协同过滤推荐算法的扩展性,实时处理大量动态数据;(2)降低系统中评分数据的稀疏性,提高推荐精度。研究了一个改进的协同过滤算法——同时基于用户与项目两个维度进行联合聚类的协同过滤方法。聚类后的矩阵规模远远小于原始评分矩阵,且同一类别内部的评分具有相似的模式,可快速灵活的进行评分预测。针对该离线聚类模型的增量更新机制提出了改进方法,将新的评分数据加入平均评分最接近的类别。针对基于加权非负矩阵分解的评分预测方法中初始值填充问题,提出了结合基线估计的初值填充方法。最后在MovieLens数据集上进行聚类效果实验与评分预测实验,验证了该联合聚类方法的有效性与实用性。
其他文献
近几年,由Facebook和Twitter所引领的社交类网站迅速发展,已渗入普通网民的日常生活。社交网络以“六度分离”理论为基础,使得人们能够在除现实世界外不断拓展自己的朋友圈子。
全文检索技术不仅可以实现情报检索的绝大部分功能,而且还能直接根据数据资料的内容进行检索。当今以全文检索为核心技术的搜索引擎已成为网络时代的主流技术之一。全文检索的
近年来机器翻译研究进展显著,但译文的质量仍存在很大的改善空间。如何在统计机器翻译模型中有效融合深层语义知识,如时态、语态信息等进行翻译,是研究热点之一。日语属于黏
图形处理器GPU善于处理大规模密集型数据和并行数据,通用并行架构CUDA让GPU在通用计算领域越来越普及。由于GPU集群的高性价比,高性能计算领域中GPU集群的使用越来越普遍,但GPU
作为云计算的核心基础设施,数据中心网络是一个连接了数万级、十万级甚至百万级的大规模服务器群来进行大型分布式计算的桥梁,因此更成为了互联网研究热点中的热点。随着网络
人脸识别是一个融合了数字图像处理,计算机图形学,特征提取,模式识别等多门技术的学科。由于人脸识别技术只需要用户的少量配合,具有非接触性的优点,已广泛使用在国家安全,银
Web技术的进步,使得社会网络(比如facebook(facebook.com)、 twitter(Twitter. com)、myspace(myspace.com)、hi5(hi5.com)等)得到了快速的发展,社会网络的快速发展也给人们
研究了二维矩形packing这一类NP难度问题。在黄文奇等人提出的拟人型穴度算法的基础之上,提出了基于动作空间的拟人型穴度算法,通过定义动作空间来简化对不同放入动作的评价,使
重复数据删除系统中面临着严重降低其性能的重复数据查询硬盘瓶颈。基于相似性的方案利用文件的相似性归类文件只在相似文件集中查找重复数据,减少数据块查找的硬盘访问至每个
随着计算机硬件和传感器网络的发展,数据流作为一种新型的数据形态广泛的存在于各个领域。由于数据流具有不同于传统静态数据的特点,传统的数据挖掘方法不再适合于数据流挖掘