论文部分内容阅读
近年来,网络及数据分析技术的蓬勃发展使得与科研相关的异构数据成指数级增长,学术大数据逐渐成为一个新兴的研究热点。作为学术大数据研究的一个重要分支,学术影响力的研究不仅为各类科技人才的培养提供了有力的依据,并且对评价社会科学技术能力和国家及地区科技竞争力与科研绩效等方面也屡见成效,其意义和价值不言而喻。人才问题不仅关系着教育、科研等资源的调控,更对综合国力的发展起到了决定性的作用。学者作为人才中的一个重要组成部分,本文对其影响力进行了深入的研究。现有的学者影响力研究中存在一些不足:如忽略学者合作关系的重要性、学术网络的演化和异构特性以及不同学者影响力的变化趋势等。针对上述存在的关键问题,本文利用学术大数据、计算社会科学、复杂网络的理论和方法,对学者影响力进行评估和预测、对影响学者成功的因素进行了深入的挖掘以及对其真实年龄进行预测。本文主要的研究内容和贡献如下:1.学者影响力的评估。针对学术合作对学者影响力存在重要影响这一事实,提出了基于学者合作网络位置的影响力评估方法。该方法一方面利用结构洞和信息熵理论提出并定义了量化学者网络位置影响的新特征;另一方面通过构建多种异构学术网络,考虑学术网络中各实体间的相互影响来对学者进行影响力评估,提升了评估方法的合理性。2.学者影响力的预测。针对现有预测方法在捕捉不同学者影响力演化方面的不足,本文提出了一种新颖的个性化学者影响力预测方法。该方法一方面根据学者自身的特征将他们划分为不同的类型;另一方面考虑学术网络随时间演化的特点,针对不同类型的学者,构建其特定的时序学术网络来预测其影响力,提高了预测的准确性。3.影响学术成功的因素挖掘。针对当前研究工作在挖掘影响学术成功决定性因素方面存在的不足,本文将影响因素进行分类,分为以文章、作者、期刊、机构为中心的因素以及时间因素,并利用机器学习算法来解决这一问题。通过实验发现,学者的平均引用次数、合作者的数量和多样性、学术年龄与他们未来的成功高度相关。除此之外,在实验中还发现了科研机构中存在“人以群分”的现象。4.学者真实年龄的预测。针对学者年龄对其影响力的重要影响以及相关数据在获取上存在的困难,提出了一种基于表示学习的学者年龄预测方法。该方法首先利用学者的论文信息,提取并分析众多影响学者年龄的因素;其次,结合上述因素对学者年龄进行预测并对其重要度进行分析。该方法在提高预测准确度的同时也能够很大程度上保护学者的隐私。