论文部分内容阅读
开展科研机构主题分布及演化研究,有助于科研机构管理人员了解本机构的研究现状、发展脉络、研究特色和最新态势,从而开展有效的研究布局、业务决策和重点扶持等工作;有助于科研人员把握所处机构的研究发展动态,挖掘相关的发展趋势和研究热点主题,明确自身所处的位置及特色,从而针对性的开展相关研宄工作。然而,现有的科研机构主题分布及演化研究所采用的方法相对单一,对主题分布情况进行分析时,存在主题提取不全面、不细致的问题,对于机构主题内容和热度演化的研究则较为欠缺。因此,本文在调研主题演化相关研究方法的基础上,深入探析主题模型方法的原理及应用,明确其优势及适用性,开展基于动态主题模型的科研机构研究主题分布及演化分析。 本研究主要从以下三个方面展开:首先,基于动态主题模型方法构建完整的科研机构研究主题分布及演化分析流程,对流程中数据集构建及预处理、文本预处理、动态主题建模、研究主题分布和演化分析共五个环节所涉及到的研究方法和技术细节进行详细阐述;以中国科学院文献情报中心和南京大学信息管理学院为例开展实证研究,通过对实验结果的分析并依照官方介绍材料进行实验结果的核对,验证流程和方法的可行性和有效性;采用共词分析方法开展实证研究,与动态主题模型方法的研究结果进行对比,明确流程和方法的优势及适用性。 最后,总结了本研究的不足点并提出未来研究展望。 本文的创新点表现在以下四个方面:基于动态主题模型方法构建完整的科研机构研究主题分布及演化分析流程,帮助管理人员和科研人员快速了解机构的研究布局和发展脉络;采用机构发文关键词构建自定义分词词典,并提出基于TF-IDF的迭代过滤方法,用于停用词的筛选和过滤;构建研究主题质量判定指标以及研究热度计算指标,用于研究主题分布和演化情况的揭示;基于构建的研究流程及方法,从机构层面和方法层面开展实证研究,验证其可行性和有效性,明确其优势和适用性。