条件偏好挖掘与推荐系统关键问题研究

被引量 : 0次 | 上传用户:woshizhuwoshizhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,偏好挖掘和推荐系统缓解了信息过载带来的困扰,给在线商业系统带来了巨大的经济效益,同时也为普通客户提供了便利,受到了越来越多的重视。偏好挖掘和推荐系统的研究涉及到知识表示及发现、决策支持、机器学习等研究领域,具有重要的学术价值。本文研究了偏好挖掘和推荐系统中几个重要的科学问题,主要包括:(1)研究了条件偏好网络(Coditional Preference Network, CP-nets)的学习方法。CP-nets具有简洁明了的特点,是近年来备受关注的条件偏好表示方法。但是,由于CP-nets的规模与变量的个数成指数关系,CP-nets的学习算法存在复杂度高、限制条件较多的问题,从不一致的训练样本中学习CP-nets尤其困难。本文对该问题建模,并提出了求解该模型的方法。本文提出的CP-nets学习算法利用了在偏好图中进行占优测试和一致性测试复杂度较低的优势,分两步从不一致的训练样本中学习得到CP-nets,即先学习得到偏好图,然后将其等价变换到CP-nets。从理论上可以证明该方法得到的CP-nets能够满足的训练样本具有最大的权重和。在模拟数据和真实数据上的实验结果表明与其它类似方法相比本文的方法具有更高的准确性。(2)为了进一步降低CP-nets学习算法的计算复杂度,研究了CP-nets的近似学习算法。在有足够多的训练样本的情况下,变量之间的条件依赖关系可采用假设检验的方法确定。据此提出了基于假设检验的CP-nets学习算法。该算法是一种近似算法,能够处理大量有噪声的训练样本。该方法虽不能保证找到问题的最优解,但当提供足够多的训练样本时,该方法能够达到满意的准确度。从理论上可以证明当训练样本数量趋于无穷时,该方法得到的CP-nets依概率收敛于真实CP-nets。此外,该方法具有多项式级的时间复杂度,有更广泛的应用空间。(3)研究了如何在推荐系统中有效利用社交关系、物品信息等附加信息,以获得更准确的推荐结果。本文对贝叶斯概率矩阵分解(Bayesian Probabilistic Matrix Factorization, BPMF)模型进行了改进,假设每一个用户和物品有不同的超参数,并根据用户的社交关系和物品信息为每个用户和物品生成相应的超参数。据此提出了融合社交关系和物品信息的贝叶斯概率矩阵分解方法。这种全新的、融合社交关系和物品信息的方法不同于传统的基于正规化的方法,也不同于基于分解的方法,能更好的应对冷启动问题和数据稀疏问题。此外,本文的方法计算高效,而且不需要调整参数,能用于数据量巨大的场合。在三个大规模真实数据集上的实验结果表明本文的方法与其它基于矩阵分解的方法相比具有更高的评分预测准确性和更快的收敛速度。另外,在冷启动条件下的实验中,本文的方法也优于对比方法。(4)研究了如何使推荐算法得到的结果更符合用户偏好的问题。本文提出了新的度量推荐结果与用户偏好之间差异的标准。并提出了优化基于此标准的矩阵分解推荐算法:以列表为单位的概率矩阵分解方法(List-wise Probabilistic Matrix Factorization, ListPMF)。由于采用了新的评价标准,ListPMF能得到的更令人满意的推荐结果。同时,ListPMF可以方便的扩展以利用社交关系等附加信息,进一步提高推荐的准确率。本文提出的方法具有较高的计算效率,能处理大型的真实数据。与现有方法的比较结果显示本文的方法超过了基于矩阵分解的其它推荐方法。最后,对全文做了总结并提出偏好挖掘与推荐系统今后的研究方向,其中包括进一步研究合理的条件偏好近似表示方法以及基于此表示方法的矩阵分解推荐方法.
其他文献
目的探讨颅脑损伤患者精神障碍与损伤的关系。方法回顾性分析 94例颅脑损伤患者的临床资料。结果在94例患者中 ,共有 6 7例出现精神障碍。重型颅脑损伤者的发生率较高 ,其表
建立合理可行的科技人员业绩评估体系 ,是我国科技体制改革工作的一项重要工作内容 ,该体系的建立不仅与科技人员的个人利益密切相关 ,而且也直接影响到科技政策的导向作用。
学校教育和社会教育是以家庭教育为基础,家庭德育在青少年的德育建设中起着不可替代的作用。对于已经进入了青春期的青少年来说家庭是自己生活最久的场所,并且正处于人生观、
<正>2013年,面对提倡节俭的新政,作为高端餐饮业代表的净雅餐饮集团在如何进行系统性应对?餐饮业是利润率最低的行业之一,2012年又遇到提倡节俭的国八条,对置身其中的人来说,
文中对基于VC++和ANSYS的发动机压装仿真计算系统进行了研究,将VC++编程技术和有限元分析软件ANSYS参数化设计语言APDL相结合,利用VC++与ANSYS软件的接口功能与VC++对APDL文
民俗文化是每个民族在其传承、发展的过程中而积淀的,它渗透于人们的生活之中。本文对河南民俗文化做了较为系统的阐述,通过对河南民俗文化中的元素进行总结归纳,提取与视觉
目的探讨护士的职业认同、专业自我概念等认知评价因素对护士职业倦怠的作用机制,尝试以新视角为其缓解工作压力和职业倦怠提供干预的依据。方法采用职业认同、专业自我概念
随着半导体技术的不断发展及节能环保理念的深入,白光LED照明即将成为继白炽灯,荧光灯,节能灯以后的第四代固体照明。与传统的照明相比,白光LED照明具有节能环保、响应速度快和高
心理形容词的下位分类可以从语法上进行分类,也可以从语义上进行分类。本文主要是从语义出发,对心理形容词内部的一个语义小类进行了研究。我们选取了一组具有相同或相近语义
合作学习正在被中小学教师在教学实践工作中广泛使用,但从当前课堂教学的情况来看,合作学习的使用中还存在着许多问题,主要表现在合作学习的要素不明确、合作学习的形式比较