个性化推荐技术在数字图书馆中的研究与应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:wangguoqiang123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展和人们对数字化知识及资源需求的不断增长,传统的搜索技术在海量数据面前已经遇到信息爆炸的瓶颈,通过基于关键词技术的搜索技术已经不能满足人们对知识的需求,在这种情况下,个性化推荐系统成为新的研究热点。个性化推荐技术从电子商务领域发展起步,已经有了成熟的互联网产品,是电子商务站点吸引新用户、保持老用户的重要技术,然而,在数字图书馆领域,个性化推荐技术还没有引起学者们的重视,读者面对千万级别的书籍文献数据,关键词搜索仍是主流的手段。本文即是在这种背景下,在电子商务领域经典的个性化推荐算法技术上做了改进,将个性化推荐技术引入到数字图书馆领域,并设计实现了书籍文献个性化推荐系统。主要工作如下:   1.对基于内容的推荐算法进行改进,引入文献新奇度、文献-用户新奇度概念,避免项目冷启动问题和推荐疲劳;引入潜语义话题分析工具,在多粒度层级上进行推荐,避免长尾效应引起的热点推荐恶性循环;   2.对基于用户的协同过滤算法进行改进,引入用户强特征、弱特征的概念,加强算法对长尾数据的挖掘能力;在相似用户之间的推荐中加入领域专家与推荐方向性的概念,提高推荐精准度;考虑用户兴趣模型随时间的变迁;   3.考虑用户对组合推荐器推荐结果的不同需求,在推荐结果排序方面加入个性化概念;   最终实验表明,经本文改进后的个性化推荐算法在多个用户行为数据环境下有效提高了经典算法的效果,可以有效为用户推荐其感兴趣的结果。  
其他文献
星载合成孔径雷达(Synthetic Aperture Radar,简称SAR)是一种工作在微波波段的主动式遥感器,因其具有不受日照和天气条件限制并对某些地物具有一定穿透能力的特点,现在已在对地
保证电路的“时序安全”-电路中时序路径的时延变化不引起同步失效-是确保电路可靠工作的基本条件之一。然而,随着制造工艺持续向纳米尺度推进,确保时序安全变得愈发困难和代价
频度、匀度和信息熵是语言的计量研究中极为重要的指标,本文对均方匀度、熵匀度和均根匀度进行了系统的比较研究,并针对均根匀度进行了深入的探索,得到了二元均根匀度和多元均根
学位
随着集成电路制造工艺进入纳米级,高性能微处理器的物理设计面临着越来越多的挑战:不断增加的工艺、电压、温度的在片波动,超大的设计规模,高主频、低功耗的设计要求。这些挑战正
本文首先说明了当前网站安全的严峻形势——网页篡改事件发生的数量剧增,再分析了传统的网站安全配置在防范网页篡改时表现出来的越来越明显的不适应性,接着分析了当前网页防
矢量场可视化是科学计算可视化领域中最具挑战性的研究课题之一,它以直观的图形图像显示矢量场的运动,使人们以直观形象的方式解释理解抽象科学数据中所包含的客观规律。线积
随着WWW上信息的爆炸性增长,在如此海量的数据中发现有用的信息变得越来越困难。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的
随着信息化技术的发展,对科技项目的管理系统,在安全性,高效性,可复用性,可维护性,开发周期等方面都有很高的要求,因此使用良好的体系结构和框架是系统开发的首要问题。本文
地球上现存的植物种类大约有50多万种,分为原核、藻类、粘菌、真菌、苔藓、蕨类、种子植物等几大类群。植物生长状况与周围的环境因素有着密切的联系,其中光照强度、空气温度、
数据挖掘是通过仔细分析大量数据来揭示有意义的新的关系、趋势和模式的过程,是信息处理技术研究领域的一项重要课题。它是指从大型数据库或数据仓库中提取隐含的、未知的、