基于异构学术网络的学者影响力评估与预测

来源 :大连理工大学 | 被引量 : 4次 | 上传用户:ILOVELUBIN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,网络及数据分析技术的蓬勃发展使得与科研相关的异构数据成指数级增长,学术大数据逐渐成为一个新兴的研究热点。作为学术大数据研究的一个重要分支,学术影响力的研究不仅为各类科技人才的培养提供了有力的依据,并且对评价社会科学技术能力和国家及地区科技竞争力与科研绩效等方面也屡见成效,其意义和价值不言而喻。人才问题不仅关系着教育、科研等资源的调控,更对综合国力的发展起到了决定性的作用。学者作为人才中的一个重要组成部分,本文对其影响力进行了深入的研究。现有的学者影响力研究中存在一些不足:如忽略学者合作关系的重要性、学术网络的演化和异构特性以及不同学者影响力的变化趋势等。针对上述存在的关键问题,本文利用学术大数据、计算社会科学、复杂网络的理论和方法,对学者影响力进行评估和预测、对影响学者成功的因素进行了深入的挖掘以及对其真实年龄进行预测。本文主要的研究内容和贡献如下:1.学者影响力的评估。针对学术合作对学者影响力存在重要影响这一事实,提出了基于学者合作网络位置的影响力评估方法。该方法一方面利用结构洞和信息熵理论提出并定义了量化学者网络位置影响的新特征;另一方面通过构建多种异构学术网络,考虑学术网络中各实体间的相互影响来对学者进行影响力评估,提升了评估方法的合理性。2.学者影响力的预测。针对现有预测方法在捕捉不同学者影响力演化方面的不足,本文提出了一种新颖的个性化学者影响力预测方法。该方法一方面根据学者自身的特征将他们划分为不同的类型;另一方面考虑学术网络随时间演化的特点,针对不同类型的学者,构建其特定的时序学术网络来预测其影响力,提高了预测的准确性。3.影响学术成功的因素挖掘。针对当前研究工作在挖掘影响学术成功决定性因素方面存在的不足,本文将影响因素进行分类,分为以文章、作者、期刊、机构为中心的因素以及时间因素,并利用机器学习算法来解决这一问题。通过实验发现,学者的平均引用次数、合作者的数量和多样性、学术年龄与他们未来的成功高度相关。除此之外,在实验中还发现了科研机构中存在“人以群分”的现象。4.学者真实年龄的预测。针对学者年龄对其影响力的重要影响以及相关数据在获取上存在的困难,提出了一种基于表示学习的学者年龄预测方法。该方法首先利用学者的论文信息,提取并分析众多影响学者年龄的因素;其次,结合上述因素对学者年龄进行预测并对其重要度进行分析。该方法在提高预测准确度的同时也能够很大程度上保护学者的隐私。
其他文献
小角X射线散射(SAXS)是测量物质内部散射单元结构信息的常用方法。本论文就SAXS方法开展了以下五个方面的研究:一.SAXS仪器参数和样品散射角度标定方法研究。大面积二维探测
近些年安乡蔬菜产业迅猛发展,并由市场导向向生态蔬菜业发展,在如何保证经济效益的同时确保质量数量,就需要不断探索市场提标准、生态提品质、质量提效益等逆推生态蔬菜发展
通过分析中国传统文化元素与智能手机UI设计相结合的理念,提出了手机UI设计应体现中国式的交流方式,通过视觉艺术和操作方式的体现来阐述如何运用手机UI设计去体现中国式交流
以海南产紫参薯为原料,采用Box-Behnken中心组合试验设计优化紫参薯花青素的超声-微波协同萃取工艺。分别采用时间模式与恒温模式两种方法,在单因素试验基础上,以花青素提取
作为学校教育基础的小学语文来说,学生良好的阅读习惯和行为对小学语文教学起着事半功倍的教学效果。通过现阶段小学阅读教学中存在的一些问题为出发点,结合自己的教学经验和
介绍了BIM技术可视化、协调性、模拟性、优化性、可出图性的优点,从岩土工程勘察、设计、施工、运营维护等阶段,阐述了BIM技术在岩土工程中的应用,指出应用BIM技术有利于优化
<正>2018年9月20日上午9:00,2018中国数字经济与文化产业创新高峰论坛在石家庄世纪大饭店隆重开幕。各界领导、专家、学者等近150位嘉宾齐聚一堂,共同探讨数字经济与文化产业
<正>根结线虫属土壤寄居性寄生线虫,可危害蔬菜,尤其是瓜类和茄科类蔬菜,损失可达30%~50%;同时,根结线虫病又加重了枯萎病、根腐病等土传性病害的发生,已成为当前蔬菜生产上的
目的探讨PCI术中替罗非班通过不同的给药方式对急性心肌梗死(AMI)患者术后心肌灌注及预后的影响。方法将行PCI术116例AMI患者,随机分为观察组和对照组各58例。对照组PCI术前
高光谱图像具有超过一百个光谱的波段,其可以提供丰富的光谱和空间信息,因此高光谱图像的应用范围越来越普遍,例如,地物、目标检测和解混等领域。尽管图像分析可以从高光谱图像丰富的数据中受益,但是庞大的数据可能会给高光谱图像的存储和传输带来沉重的负担。因此,如何有效压缩成为高光谱图像应用中的一个重要问题。压缩技术大致可以分为两大类:无损和有损压缩方法,这取决于是否可以将压缩数据精确地重新生成原始图像。对于