论文部分内容阅读
随着信息与互联网技术及其应用的不断发展,不仅数据量呈爆炸式增长,数据结构也越来越复杂。面对“信息过载”带来的难以对所需信息进行分析判断与选择利用等负面影响,人们在搜索引擎的基础上,便引入基于个性化推荐的信息过滤技术。在诸多的个性化推荐中,以协同过滤推荐算法最为常用,而其中尤以隐语义模型协同过滤推荐算法最为典型。但隐语义模型在评分矩阵分解降维的过程中,会有部分隐含特征信息丢失,从而影响推荐的准确性。因此,依据相似传递性,建立基于(用户与项目)属性相似隐语义模型,以弥补丢失的部分隐含特征信息。另外,不同的协同过滤推荐算法具有不同的优势和缺陷,又依据数据可比融合性,建立基于方差和最小变权融合模型,以平衡不同协同过滤推荐算法对评分矩阵特征提取的差异性。以基于属性相似隐语义模型和基于方差和最小变权融合模型为基础,提出“基于属性相似隐语义模型及其变权融合协同过滤推荐算法”。本论文通过辩识协同过滤推荐算法的国内外研究历史现状和课题研究的意义依据,构建了课题研究的目标内容与技术路线;进而讨论个性化推荐的基本知识,分析基于隐语义模型等协同过滤推荐算法和融合推荐算法的基本思想、技术结构和过程方法。由此开展课题关键问题研究,提出了基于属性相似隐语义模型与基于方差和最小变权融合模型的基本思想与框架结构,构造了基于属性相似隐语义变权融合协同过滤推荐算法的数据流程与计算流程;并分模块地对算法进行描述,并利用Python3加以实现。通过模拟仿真实验,基于属性相似隐语义模型性能完全超过隐语义模型,弥补了隐语义模型隐含特征信息丢失的缺陷,预测关联度和预测准确度均得到提高,在隐因子F大于或等于50以后,,均方根误差逐渐下降收敛至0.94-0.95区间。当F=80时,基于属性相似隐语义模型相对于传统隐语义模型提升比较明显,预测准确度提升1.12%,而预测关联度提升4.9%。通过多种协同过滤算法的变权融合,基于属性相似隐语义变权融合协同过滤推荐算法在基于属性相似隐语义模型的基础又有了提升,在F=80时预测准确度提升0.9%左右,预测关联度提升0.58%左右。