【摘 要】
:
矩阵分解因其模型简单但是效果显著而成为推荐系统领域非常流行的模型之一。但是在互联网时代,在线信息量呈爆发式增长。这种发展趋势一方面促进了个性化推荐系统的广泛应用,
论文部分内容阅读
矩阵分解因其模型简单但是效果显著而成为推荐系统领域非常流行的模型之一。但是在互联网时代,在线信息量呈爆发式增长。这种发展趋势一方面促进了个性化推荐系统的广泛应用,另一方面要求数据挖掘类算法向并行分布式方向转变。只有具有良好可扩展性的分布式算法才能处理日益庞大的数据集。因此,近几年来,大数据研究人员致力于研究大规模矩阵分解问题的分布式解决方案。而已有方案在效率、可扩展性等方面仍有很大提升空间。因此,本文提出了一种新的解决方案并将其命名为DS-ADMM(Distributed Stochastic Alternating Direction Methods of Multipliers)。该方案首先提出了一种新的数据分割策略。该策略能够将分布式矩阵分解问题分解成适用于ADMM框架的结构。在此基础上,本文设计并提出了DS-ADMM。为了评测该算法的性能,本文使用MPI(Message Passing Interface)实现该算法,并设计了多组实验测量DS-ADMM和多个已有算法在若干真实数据集上的运行性能。实验结果表明,不论是在效率还是在精度上,DS-ADMM都明显优于已有的分布式矩阵分解模型。
其他文献
本文利用?vestka提出的冕拱磁场位形研究了冕拱振动的频率,在处理磁场方面并没有从复杂的MHD出发,而是从法拉第引入的磁感线出发。所以可以从几何的角度去理解冕拱的磁场,通
网络的社团结构(Community Structure)作为复杂网络的一个重要特征,发现网络的社团结构是一项非常基础且重要的工作。实际中社团的重叠性(Overlapping)和社团的层次性(Hierar
恒化器是一类描述开放生态系统和实验室生物反应器中物种竞争的基本数学模型.本文研究如下具有拥挤效应的非均匀恒化器:边界条件为初始条件为S(x,0)=S0(x)≥0, u(x,0)=u0(x)≥
摘要超代数系统理论和模糊类型理论均具有计算机科学与纯粹数学的双重研究背景,其中超代数理论在纯粹数学和应用数学的许多方面都有着重要的应用,而模糊类型理论最初是以剩余
海洋芽孢杆菌(Bacillus marinus) B-9987是从我国渤海潮间带植物盐地碱蓬(Suaeda salsa)的根中分离得到的内生细菌,具有产生丰富次级代谢产物的能力,其中能够产生丰富的Macro
酿酒酵母(Saccharomyces cerevisiae)细胞中不同细胞器之间的囊泡运输受到属于Ypt/Rab家族的小G蛋白(GTPase)的调控,这些小G蛋白会在GTP结合态(活性形态)和GDP结合态(非活性
本实验室使用EMS(甲基磺酸乙酯)诱变处理拟南芥,筛选得到一个与表皮细胞发育相关突变体pipe。通过图位克隆的方法克隆到目的基因,该基因编码一种蛋白磷酸酶。本实验在pipe突
由于其在构造上的简洁性,又能够保持目标函数的单调性、凸性等优良性质,Bernstein算子在算子逼近乃至整个函数逼近论中一直占有非常重要的地位Bernstein算子在泛函分析、计算
原生动物纤毛虫是一类单细胞真核生物,因为它的高度分化,一些纤毛虫已经成为很好的研究材料。形成包囊和脱包囊的现象不仅存在于寄生性的原生动物中,在许多自由生活的纤毛虫
时间序列预测在20世纪70年代的时候被提出,它是一种基于历史数据的基础上对未来问题进行预测的技术。时间序列预测技术现今发展相当迅速,在很多领域都有运用,如工程、经济、