论文部分内容阅读
科学实验作为科学研究的一种重要方法,其产生的科学实验数据是科学数据的重要组成部分。相对于大学科有完整的政策保障科学数据的有效组织,来源于小学科的科学实验数据因缺乏关注及重视,组织现状混乱、数据丢失严重,导致很多科学实验无法复现和再分析,科研成果的验证、实验方法追溯以及实验数据的复用存在很大困难,因此亟需有效手段实现小学科实验数据的保存、组织和维护,保证数据格式的更新可用。本文以植物学学科为背景,通过“用户访谈+德尔菲法”完成植物学基因表达实验元数据模型的初步构建和修正;利用本体技术探讨、构建元数据模型间的语义关系,实现异源、异构科学实验数据深度描述、组织和链接;最后利用D2R编制映射文件完成实验数据RDF格式转换并发布关联数据,该组织模型支持关联数据的访问、与web信息的无缝链接以及基于SPARQL的关联数据检索,成功构建了轻量级、多维科学实验语义关联数据网络。本文通过以下三个步骤实现了植物学基因表达实验数据的组织:(1)植物学基因表达实验元数据模型构建首先通过文献调研对现有科学实验元数据集进行总结;其次通过用户访谈对基因表达实验数据组织现状、实验操作流程、特点、实验数据组织需求进行调查,完成植物学基因表达实验描述模型的初步构建;最后通过德尔菲法对元数据元素集打分、评估、筛选,确立了基于用户需求、专家参与的植物学基因表达实验描述模型。(2)植物学基因表达实验本体构建基于语义网思想,发现、挖掘并构建实验描述模型中类与类、实体与属性间的语义关系,整合、复用已有元数据标准及FOAF、DCMI、BIBO、EXPO等相关本体的概念、属性,通过本体构建技术、protege本体构建软件构建植物学基因表达实验本体,实现元数据集、元数据集与其他相关数据集的互操作。(3)植物学基因表达实验关联数据构建与发布基于关联数据唯一 URI可访问的核心思想,借助D2R关联数据技术编制manpping映射文件,完成实验数据与web可访问地址的动态绑定,并以关联数据形式发布,实现实验数据以语义链接为基础的组织、关联、访问及基于SPARQL的科学实验数据检索与定向浏览,同时支持本地实验数据与实验科研成果、作者、相关机构等外部数据的连接访问。本文创新点为以“用户访谈+德尔菲法”为基础,综合运用本体、关联数据多种技术,设计并实现了一种科学实验数据描述模型,用户访谈了解专业领域科学实验数据的组织现状与组织需求,完成科学实验描述方案的初步构建,德尔菲法完成方案性元数据模型的打分、筛选及修正,基于该构建流程的科学数据描述模型能够满足领域用户的现实需求,遵循科研人员的科学数据组织习惯,领域专家的知识支持保证了描述元数据的科学性、专业性。