基于改进PageRank算法的文献价值评估方法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:wangyabing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文献资源是科研人员学习和研究的重要参考资料。如何将价值高的文献优先推荐给文献检索者是一个重要而有意义的问题。传统的文献价值评估方法仅仅依靠文献的被引次数来判断文献价值的高低,这种方法没有考虑到文献价值的来源和引文之间知识的流动和价值的认可。因此,本文在改进PageRank算法的基础上,对文献价值评估方法进行了研究,主要研究内容如下:通过对引文之间相互关系的分析,文献的价值主要来自两个部分:文献自身固有的价值和引用它的文献传递过来的价值;本文从文献属性出发,考察分析了文献价值的特点,找出了影响文献价值的各种因素,主要包括文献的被引次数、文献的发表时间、文献所在期刊或会议的级别、作者的权威度、文献的内容等。从文献价值的来源出发,结合影响文献价值的因素,本文提出了一种基于改进PageRank算法的文献价值评估方法。该方法分别从文献的固有价值和其它文献传递过来的价值两方面计算文献的总价值。文献自身固有的价值是指文献一经发表就确定的价值,本文利用文献所在期刊或会议的影响因子作为评估文献固有价值的一个指标。随着时间的推移,文献的固有价值存在着老化的现象,所以文献发表时间也是影响文献固有价值的一个因素,本文引入时间衰减函数来反映文献固有价值随时间的衰减。其它文献传递过来的价值主要由文献之间的相互关系决定,本文引入文献之间的相关度作为文献之间价值传递的指标。将PageRank算法和上述三个指标相结合,计算得到文献的总价值。通过具体实验验证,基于改进PageRank算法的文献价值评估方法是有效的,能够将价值高的文献优先推荐给用户。
其他文献
随着社会的进步和科技的飞速发展,人们的生活已经越来越离不开网络了,为了满足人们日益增长的需求,海量的网页信息也随之产生了,如何从这些海量的信息中找到人们所需要的信息
信息全球化的不断发展,网络技术发展不断成熟,信息交换的发展更加的细化,很多企业甚至是规模较小的企业都拥有自己的完善的内部网络系统,通过内部网络更加安全的完成企业内部
随着现代战争的突发性、快速性和复杂性的不断增强,这就要求通信必须迅速、准确和不间断地传输信息。因此,在指挥自动化系统中,良好的通信保障,是实施及时、正确指挥和快速作
电信运营商OSS(Operational Support System)即电信业务支撑系统,是一个自动化、高性能的电信业务引导、修复及开通运行的支撑系统,利用OSS可以向用户提供多种多样并且稳定可
隐喻是人类基本的思维方式之一,在自然语言中,隐喻的使用是一种非常普遍的现象。现今,隐喻已经成为了语言学家,心理学家和认知科学家所关注的课题之一。一切自然语言处理系统的本
随着计算机的普及和网络技术的飞速发展,互联网上出现了海量数据可供人们利用,关系型数据是其中最主要的数据组织形式之一。在关系数据库中,键集合信息是理解数据库结构和特征的
遗传算法是现代计算机科学与优化理论中被广泛关注的智能进化算法之一,在实际应用中,标准遗传算法存在着许多不足。针对搜索效率低和无客观判敛标准的缺陷,本文提出了一种基于单纯同伦算法的改进遗传算法。单纯同伦算法是求解不动点问题的有效算法,具有收敛快、局部搜索能力强的特点,与全局搜索能力强、无客观收敛标准的遗传算法相结合可以收到较好的效果。改进算法首先将优化问题转换为不动点问题,将n维函数优化问题放到高一
随着人们生活水平的进一步提高,车辆越来越多,高速公路交通拥堵、交通事故等重大交通问题日益凸显,为了解决此类问题,填补空白,创新性的设计了高速公路交通控制器。其利用外场设备
随着互联网和物联网技术的飞速发展,人们身边充斥着大量丰富多彩的网络信息,但是人们难以及时、准确地获取全部的有用信息。目前需要一种在不同环境下,满足不同用户的需求并
标签的质量直接影响着资源的查找、定位与分享的效果,因此进行高效全面的标签挖掘极有必要。在标签挖掘研究中,标签推荐和标签冗余处理是其中的两个重点。针对现存标签推荐方