论文部分内容阅读
个性化推荐系统是解决电子商务迅猛发展带来的信息过载问题的有效工具,关于它的相关研究逐年递增。许多需要用到大量客户信息的“奢侈”推荐算法与客户隐私保护日益受关注相矛盾,而关联分析方法以其简单易用、可离线完成预计算、不需要分析客户信息等特点一直被广泛应用于商业推荐系统环境尤其是非结构化数据中。然而,使用关联规则工具会生成大量推荐规则,如何从众多的规则中生成最终的推荐方案是重要的研究课题。不考虑应用背景,直接在规则集中选择最优规则的方法会丢失大量客户偏好信息,经常会出现顾客真正满意的规则,由于支持度或置信度低而被淘汰,所以充分利用应用领域知识是重要的解决思路。用户评分信息是易获取且有价值的领域知识。结合有评分信息的关联规则集在生成推荐方案时有两种研究方向,第一种仍然是删减次优规则选取最优规则,第二种是尽可能多地集结规则集的信息从而尽可能多地利用规则信息,利用群决策思想是较为新颖的研究方向。本文针对这两种研究方向中各自存在的问题,分别给出两种新的推荐算法以及实验分析:(1)针对结合评分信息的关联规则推荐系统选择最优规则时会遇到规则有多个不同量纲的评价标准,且纯粹定量方法并无太大的实际意义以及可解释性的问题,引入定性与定量相结合的模拟人思维过程的AHP (Analytic Hierarchy Process)层次分析法,提出了基于层次分析法的关联规则推荐算法,有效解决了多重评价标准下最佳推荐规则选取困难问题。(2)第一种选取最优规则的思路虽然简便当仍存在规则信息利用不充分问题,所以,本文又提出一种基于行为和评分相似性的关联规则群推荐算法,针对客户个人信息受到保护时仅有商品名称和评分信息的推荐情形,将规则及相应的评分信息视为推荐专家,将推荐结论相同的专家合并为一个专家组,利用客户行为和评分的双重相似性计算专家权重,并利用群决策的思想集结专家组的推荐意见,从而给出最佳推荐方案。(3)在本文的两种算法后均选取了Grouplens Research公开的电影点播及评分数据集对算法的准确率和满意率进行实验分析与验证,并给出了是实验分析比较图,证明了算法的可行性。本文利用层次分析法、行为和评分相似性以及群决策等思想解决了关联规则推荐算法应用中存在的两个问题,并提高了算法推荐的准确率和满意率,为推荐算法的进一步研究提供了新的思路。