论文部分内容阅读
大数据环境下,随着科学技术的飞速发展、科研工作的日益复杂,各个领域的学者越来越注重科研合作交流,这种合作不仅包括显性的合作关系,还包括未来潜在合作关系,因此如何快速准确地找到未来潜在合作对象逐步成为图书情报界的重要研究内容。 网络模型的构建是作者潜在合作关系研究的基础。在理论和方法层面,本文利用超网络可以融合多种属性的特点,并结合科研合作网络的特征,引入超网络模型,从作者、关键词和研究主题三个维度上构建作者合作超网络模型。在技术层面,本文首先提出基于叙词表的关键词网络优化方法,然后将基于LDA模型的作者主题分类方法与作者关键词耦合强度计算方法融合,最后根据作者潜在合作关系空间的定义,实现作者潜在合作关系的挖掘。 在此基础上,本文利用肿瘤领域数据开展实证研究,分别就叙词表优化和作者潜在合作关系挖掘进行实验验证,实验表明叙词表优化后的网络使得作者的研究主题更加明确,有利于基于研究主题进行作者聚类,同时将实验结果与传统VSM方法进行比较,准确率、召回率和F值分别平均提高了30.75%、17.78%和24.05%,表明基于超网络理论和本文的技术方法,能够有效地挖掘作者潜在合作关系,具有较强的应用价值。