数据驱动的科学研究相关性与影响分析——以国家自然科学基金数据分析为例

来源 :国防科技大学   | 被引量 : 0次 | 上传用户:luohua0891
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学学是研究科学的科学,它旨在理解、量化和预测科学研究及其产生的结果和影响。科学学揭示了科学和科学活动发展规律,并将这些规律应用于促进科学的发展,辅助科学发展战略、规划、政策制定,使得科学研究有效进行,是科学研究组织管理的重要工具。大数据时代的到来,为科学学的研究提供了丰富的数据源和数据分析手段。开展数据驱动的科学研究相关性与影响分析,对科学学领域研究具有重要的理论意义与实践价值。
  本文以国家自然科学基金数据分析为例,结合Selenium进行网络爬虫程序的编写以成功得到研究所需的科学基金及其成果数据,编写正则表达式提取科研成果中的基金信息进行科学基金和成果数据的关联;分析基金项目数据和成果数据特点,基于数据分析需求下对于蕴含大量关系的科学基金成果数据寻求科学高效的数据管理方法,采用以关系为核心的图数据库Neo4j数据管理方法;应用科学计量学、社会经济学和相关性分析等方法分析探讨数据背后潜在的规律:采用社会经济学指标对科研经费在科研机构之间的分配不均衡进行定量评估,表明科研经费在机构间分配上均存在较大差距;从单项科研经费投入和机构科研经费投入两个层面上研究了科学基金投入与成果产出数量的相关性,显示单项目成果数量与该项目立项金额无明显相关性,机构科研经费和项目成果数量存在强相关关系;4)构建了机构合作网络和国家(或区域)合作网络,基于复杂网络分析方法、多属性决策方法对科研合作网络演化过程及合作模式进行分析,科研投入对这两种网络规模和密度均有着不同的促进作用,机构的经费水平对机构在合作网络中的“地位”有着明显的影响。
  本研究提出了科学研究数据获取与图数据库相结合科学研究数据管理方法;探索分析了科学研究经费分配不均衡与成果相关性;开展了基于复杂网络模型的科学基金合作关系及影响分析。本研究提出的方法,为科学研究数据获取及管理提供技术支持,为科学学提供了科学基金-论文数据分析方法,研究结果为科学基金管理部门提供决策支持,推动了科学学领域研究发展。
其他文献
我国经济发展进入新常态,处于新旧动能转换、经济结构调整的关键时期,产业转型升级能够推动经济增长方式转变,为新旧动能转换提供强大支撑。山东省作为新旧动能转换的先行省份,产业转型升级是其经济发展的关键主题,研究山东省各地市产业转型升级的水平、驱动因素以及对策具有重要意义。基于此,本文首先构建了包含产业转型升级方向合理度、产业转型升级高度、产业转型升级速度3项二级指标以及产业结构合理度、资源利用合理度等
学位
产能过剩和技术转型升级使炼油企业竞争加剧,当炼油企业在资金、技术、人力等方面差距越来越小时,其差距便体现在企业对供应链的管理与优化上,供应链生产计划层面的优化问题成为热点。本文研究供应链生产计划,考虑炼油企业中需求与产率不确定性,在对炼油企业供应链结构与不确定性分析基础上,发现需求与产率不确定性是研究不同计划周期不同产品的用户需求量,与不同计划周期不同生产方案下不同产品的产量,通过刻画不确定性损失
学位
我国现处于经济高速发展时期,对石油资源需求量巨大,但国际石油市场动荡不安,这决定了我国应重视国内石油开采水平。然而,油田开发项目成本高、不确定性强、投资风险大,给石油公司的投资与经营带来巨大困难。如何在各油田分公司递交的油田开发项目中合理选择、如何使石油公司的投资达到预期效益最大化及其与预期投资风险之间的平衡是石油公司亟待解决的问题。本文结合油田开发项目的特点,综合考虑石油公司现有投资评价方法存在
学位
山东省是我国的第三经济大省,经济一直保持中高速发展,碳排放量位居全国第一。高能耗产业以及新型城镇化的快速发展导致山东省对能源的需求日益增长。受经济发展水平和相关技术的制约,山东省的能源消费结构一直以煤炭为主,可再生能源开发不足,能源利用率低下。因此,研究山东省的经济增长与碳排放之间的脱钩效应及其驱动因素对促进经济的高质量发展具有重要意义。为此,本研究在新型城镇化发展的背景下调查了1995-2016
学位
在过去的十年中,以中国为代表的新兴市场中的影子信贷供应迅速增长,同时对金融市场的影响也随之增强。目前已有研究主要关注于货币政策和流动性监管如何导致新兴市场影子银行的崛起,这些研究为影子信贷对金融市场的影响提供了一些定性证据。但对于影子信贷对经济的影响以及影响程度的研究相对较少。本文将中国银行理财产品收益率与一年期存款利率间的利差进行分解,获取了影子信贷的非违约及违约溢价部分。实证结果表明,银行理财
学位
在计划的工期内完成工程项目的建设,是承包商重要的工程控制目标之一,大型建设工程项目建设工期长,由于项目管理的复杂性,工期延误事件的发生不可避免。因此,工期索赔管理是承包商在项目管理过程中的重要环节,成功的工期索赔能够帮助承包商获得良好的项目收益,也有利于承包企业的运营。国际工程项目中,承包商和业主依据合同条款进行索赔,更是一种契约精神的体现。承包商应该具备良好的工期索赔意识和能力,通过索赔的途径维
学位
信息技术进步引领着世界步入共享经济的时代。网约车、共享单车、民宿、知识技能分享等共享经济应用在人们的日常生活中逐渐普及。如何吸引和维持足够大的用户群体、引导和巩固用户的重复使用行为,即用户对共享经济服务平台的“黏性”,成为共享经济平台价值共创的关键。近年来,随着共享经济市场的饱和及服务平台企业的分化整合,行业发展模式正在发生深刻转变,其主要竞争手段从价格大战逐步转变为体验改善。因此,研究共享经济的
随着网络基础设施的发展和社交媒体网络应用的普及,越来越多的用户在社交媒体当中相互联结。这为商业广告的在线传播创造了新的机会。与传统的网页广告需要向平台方为广告展示位置付费,且展示仅限于本网页内的模式相比,商家可以在社交媒体平台上开设官方账号,用于发布广告,并可以通过其他用户的转发来进行平台内的扩散。这种新的广告传播模式,由于加入了转发者的背书,对于商家而言将会带来诸多有利的结果。因此,这一模式被全
学位
随着大数据时代的深入发展,移动互联网、物联网的快速发展,人们每天面临海量信息选择。但是人类在处理信息的方面是有极限的,大量信息的涌入,远远超过了人们的承受能力,甚至是需要的信息量被淹没在大量信息里无法识别。如此大量不相关的信息已经让人们失去了对所需信息的获取和选择能力。冗余信息如何筛选过滤,这个问题就凸显在了人们面前。在搜索引擎之外,个性化推荐系统就是一种人们常用的信息过滤手段。个性化推荐系统的超
本文首先对智能虚拟助手的相关研究进行了综述,回顾了从智能产品到智能虚拟助手的概念延展,以及智能虚拟助手的研究现状,对IS环境下,压力源的相关研究进行了梳理,从技术压力到压力源-应对框架的文献进行了综述。本文的研究从以下两个方面展开。第一,本文在前人研究的基础上,采用LDA主题模型对3614条社交问答平台的问答文本进行主题分析,提取出了三个主题,即析出了三个构念,即社会尴尬、隐私担忧和认知处理过载。