论文部分内容阅读
大数据时代,科研工作者需要从海量无序的科研信息中迅速获取有价值的信息为课题研究和情报分析服务。科技文献是包含专业语义信息的非结构化文本,长期作为情报学领域的重要研究对象之一。如果能将其结构化或者部分实现语义化表示,有助于提高用户对科技文献的理解与利用效率。 随着科技文献数量的急剧增长,科技文献资源的管理与服务工作的主要挑战已经从文献的快速获取转变为有效满足用户多元化、多层次的知识需求。如何有效地揭示文献内容、发现有用知识,成为提升科技文献资源组织、利用和服务水平的重要研究课题。 本文从科研事件的视角,将一篇科技文献看作一个事件,从科研事件的提出与表示、基于科研事件间的关系构建科研事件链、科研事件网络模型的设计与构建、科研事件与科研事件网络的应用等方面系统地开展基于文献的科研事件网络构建研究。本文主要研究内容分为三个部分:第一部分,介绍科研事件这一概念并从定义和表示模型两方面对其进行研究。通过分析科技文献在元数据和文本内容方面的特征并对科技文献进行描述,划分为内部特征和外部特征,从中抽取出科研事件的六个基本事件要素,并以六元组的形式表示。第二部分,说明了科研事件网络是由节点和边组成的语义链接网络,节点为科研事件,边为科研事件间的关系。通过分析和梳理科研事件之间的关联关系,并构建相应的科研事件链,由多种类型的科研事件链接形成科研事件网络。第三部分,分析科研事件网络在科技文献语义检索方面的优势,通过梳理科研事件发展脉络来探讨科技文献中知识的演化和发展规律。