学术论文排序预测算法研究

来源 :内蒙古大学 | 被引量 : 4次 | 上传用户:yancliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文排名预测是通过一定的算法预测论文的价值,并按预测结果对论文排名。在学术社会网络中,排名预测算法能够给出在未来也会持续得到关注的论文,这对于科技工作者把握当前及未来的研究方向起着积极的指导作用。目前常用的学术论文排名标准包括PageRank、HITS等。这些传统的文献评价方法,主要通过文献的引用进行重要性传递对论文进行评价。然而,在引文网络中引用关系暗含着知识的传递,即引文与被引文献之间文本的关联程度,这种关联程度影响着引文对被引文的重要性传递,且对于传统的评价方法来说,引文网络只是当前时间的一个快照,存在新节点排挤问题。同时,典型的论文排名预测算法CiteRank只考虑了论文的发表时间,FutureRank算法仅涉及论文的发表时间、作者权威度和论文已有的PageRank值。此外,学术关系发展呈现多样性,学者在检索论文时,会考虑多种因素,如引文次数、相似度、期刊/会议的影响力、作者权威度等,这些因素也隐含对文献的价值的评估。因此,我们在对文献排序预测时应综合考虑各种可能对论文价值评估产生影响的特征。针对以上方法存在的问题,我们提出了通过预测文献相对引用次数实现对文献未来排序的算法FRP(Future Ranking Prediction)。FRP算法包括以下四步:(1)基于引文与被引文的文本间的关联强度、引用的新旧对论文重要性传递的影响,通过引文网络分别计算论文的PageRank值、波纳西茨权力指数;(2)通过引文网络和合著网络获得作者的文献发表量、权威度、平均被引次数以及合著特征;(3)结合引文网络与论文发表时间抽取文献的引用率;(4)利用(1)(2)(3)抽取的特征,通过BP神经网络学习来预测文献未来排序。实验结果表明FRP方法提高了预测准确率。
其他文献
时空统计分析方法是处理大量数据、揭示事物内部规律的有力工具。海洋大气环境是一个典型的多维动态变化环境,由于时间维和高度(或深度)维的引入,数据量急剧增加。多变量大样
进入新世纪以来,随着信息技术尤其是无线通信技术的发展,一种具有独特网络特性的网络——机会网络走入了人们的视野。这是随着无线网络应用的逐步扩大到各个领域中,人们发现
网格是新一代的互联网,是一种新的信息基础设施。它将引发继传统因特网、WEB之后的第三次信息技术革命。将网格技术应用于铁路货物运输系统属全国首例。建立铁路网格平台,可
互联网的发展和广泛应用带来了网络安全问题,从而促进了入侵检测技术的发展。如今,入侵检测系统取得了长足的进步并获得了广泛应用,但仍存在一些问题。本文的研究内容是入侵
本文研究的传媒业务支撑系统(MBSS,Media Business Support System)是利用互联网为载体,在网上发行、传播的应用系统。该系统不仅为广大客户提供方便、快捷、丰富的商业信息,
随着信息技术的发展和网络带宽的提升,视频数据量成爆炸式增长。图像特征提取近年来成为图像研究的热点,在此基础上的视频中的文字是视频语义理解的重要信息来源。由于视频是
卷积神经网络(Convolutional Neural Network, CNN)是一种源于人工神经网络(Neural Network, NN)的深度机器学习方法,近年来在图像识别领域取得了巨大的成功。CNN由于采用局
在数据挖掘领域中,关联规则是一种非常重要的技术.Apriori算法是其最经典的算法之一。关联规则从布尔型属性开始研究,发展到名称型属性。目前,数值型属性的关联规则已经成为
随着多媒体技术和计算机网络技术的飞速发展,数字多媒体信息的存储、复制与传播变得非常方便。这给数字媒体的盗版提供了非常便利的条件,直接威胁着数字媒体创作者和拥有者的
基于阵列天线的多用户识别涉及数字信息流相互干扰的信息解调,通常应用在如无线通信,高速数据传输,卫星通信,数字电视和磁记录等领域。多用户识别技术的发展是当代通信技术领