论文部分内容阅读
在互联网时代的今天,每天都会有大量的信息产生,信息的增长速度已经远远大于人类可接收的上限。由于信息过载,人们能否从海量的信息中高效地筛选出所需要的信息变得至关重要。个性化推荐系统正是为了解决这个问题而发展起来的。而随着用户每天在互联网上浏览新闻资讯的需求与日俱增,为用户提供个性化新闻推荐服务已经是主流趋势。其中,如何正确理解并表示用户的兴趣偏好,并使用合适的推荐方法进行推荐,是近年来的研究热点。 本文针对个性化新闻推荐问题,研究如何挖掘用户的兴趣并对其进行个性化推荐。首先,本文提出了一种分析用户兴趣偏好的方法,将“尼尔森F形状网页浏览模型”引入到分析用户点击浏览行为的过程中,结合层次分析法对版块之间的重要性程度进行打分赋值,挖掘出用户在不同主题下的兴趣概率分布。其次,本文提出了一种基于LDA主题模型和层次分析法的文本信息推荐方法,该方法以LDA主题模型为基础,挖掘出文本和主题之间的概率分布与主题和词汇之间的概率分布,然后通过上述方法得出用户的兴趣概率分布,利用该分布与通过LDA主题模型挖掘出的用户和主题之间的概率分布相结合,从而优化文本信息推荐的效果。最后,本文以“中俄经贸合作网”为实验对象,使用其后台服务器日志数据对本文所提出的推荐方法进行测试。实验结果表明,通过与LDA主题模型推荐方法的对比实验发现本文推荐方法在准确率和多样性上具有相对的优势,在原有的推荐效果上得到了一定的提升。