基于主题模型的学术论文推荐系统研究

来源 :大连海事大学 | 被引量 : 30次 | 上传用户:zangye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术论文推荐是推荐系统的一个应用方向,可以帮助用户在数千万的文档中找出那些需要的论文。它可以通过对用户的历史访问记录进行分析,挖掘出用户潜在的需求,并向其推荐与之相关的内容,使得用户查找论文的过程变得简洁、方便。鉴于被推荐的物品(学术论文)的特殊性,仅仅使用准确度来衡量推荐结果显然不足以满足不同用户的各种需求。本实验将提高推荐结果的惊喜度作为主要目标。所谓惊喜度是指发现那些用户并不了解却确实需要的物品的能力。本文采用基于主题模型的方法,在文档中单词分布已知的情况下,计算每篇文档主题分布的后验概率,挖掘出其潜在主题与结构。它不再像传统的空间向量模型那样,只单纯的考虑文档在词典空间上的维度。这种单纯的基于词频统计的方法,无法捕捉文档内部以及文档间的统计特征,也无法捕捉到文档的语义特征。而主题模型则是引入了了主题空间,实现了文档在主题空间上的表示,不仅可以捕捉到文档内的语义信息,从而发现文档间潜在的联系,而且给于用户和论文推荐很好地解释性。文章主要内容一共分为三个部分。基于LDA主题模型的推荐,是根据文档在主题上的分布概率进行推荐的。这种在主题层面上的推荐可以有效的解决一词多义,异形同义等问题。这对分析文档内容,抽取文档特征具有很重要的意义。而且与基于TF-IDF的推荐相比,期望得到惊喜度更高的推荐。基于CTM关联主题模型的推荐,在LDA的基础上,考虑到了主题之间的关联,能够更有效的发觉文档间的潜在关系,使惊喜度得到进一步的提高。基于相关反馈的推荐在之前的基础上加入了用户评分,系统可根据用户的反馈形成用户形象,从而对于不同用户给予不同的推荐,使得推荐结果更加个性化。
其他文献
我是一只珊瑚虫,一种非常小的生物,只有几毫米大。我的嘴长在上面,周围有一圈用来捕食的触手,下面就只剩一个胃了。在我生活过的地方,会留下坚硬并且中空的珊瑚。
期刊
规划环境影响评价指对规划实施后可能造成的环境影响进行分析、预测和评价,提出预防或者减轻不良环境影响的对策和措施,综合考虑所拟议的规划涉及的环境问题,预防规划实施后对各
本文从警务辅助人员的简述出发,结合实际情况,对如何发挥社会治安防控体系中警务辅助人员的作用,切合实际的进行讨论分析工作。
在分析行波信号奇异性的性质和小波基特征的基础上,提出了奇异信号检测中小波基的选择原则,针对行波信号中出现的2种不同类型的奇异信号分别选出合适的小波基。对于突变奇异
当前农村土地改革是推进新型城镇化和农业现代化发展的重要内容,落实中央改革思路的关键是要实现农村土地产权清晰化和保障农民土地财产权。面对农村土地产权价值实现过程中
鉴于国内学术界普遍视一裁终局为国际商事仲裁的主要优点并将其绝对化,《中华人民共和国仲裁法》第9条规定仲裁实行绝对的一裁终局制度,运用比较分析法考察世界上主要国家和
听力作为二语习得的四个基本技能之一,在促进语言学习中起着关键性的作用。早期的听力教学主要依靠教师的讲授来完成。随着认知心理学的发展,人们发现在听力学习中,“如何学”比
随着信息处理技术在钢铁行业的不断应用发展,鞍钢集团对生产管理的信息化提出了较高的要求,由于热轧钢卷库具有库存种类多样、流动性强、信息处理量大的特点,因此对热轧钢卷