基于关联数据的科学数据组织模式研究

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:jackie_kara
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学实验作为科学研究的一种重要方法,其产生的科学实验数据是科学数据的重要组成部分。相对于大学科有完整的政策保障科学数据的有效组织,来源于小学科的科学实验数据因缺乏关注及重视,组织现状混乱、数据丢失严重,导致很多科学实验无法复现和再分析,科研成果的验证、实验方法追溯以及实验数据的复用存在很大困难,因此亟需有效手段实现小学科实验数据的保存、组织和维护,保证数据格式的更新可用。本文以植物学学科为背景,通过“用户访谈+德尔菲法”完成植物学基因表达实验元数据模型的初步构建和修正;利用本体技术探讨、构建元数据模型间的语义关系,实现异源、异构科学实验数据深度描述、组织和链接;最后利用D2R编制映射文件完成实验数据RDF格式转换并发布关联数据,该组织模型支持关联数据的访问、与web信息的无缝链接以及基于SPARQL的关联数据检索,成功构建了轻量级、多维科学实验语义关联数据网络。本文通过以下三个步骤实现了植物学基因表达实验数据的组织:(1)植物学基因表达实验元数据模型构建首先通过文献调研对现有科学实验元数据集进行总结;其次通过用户访谈对基因表达实验数据组织现状、实验操作流程、特点、实验数据组织需求进行调查,完成植物学基因表达实验描述模型的初步构建;最后通过德尔菲法对元数据元素集打分、评估、筛选,确立了基于用户需求、专家参与的植物学基因表达实验描述模型。(2)植物学基因表达实验本体构建基于语义网思想,发现、挖掘并构建实验描述模型中类与类、实体与属性间的语义关系,整合、复用已有元数据标准及FOAF、DCMI、BIBO、EXPO等相关本体的概念、属性,通过本体构建技术、protege本体构建软件构建植物学基因表达实验本体,实现元数据集、元数据集与其他相关数据集的互操作。(3)植物学基因表达实验关联数据构建与发布基于关联数据唯一 URI可访问的核心思想,借助D2R关联数据技术编制manpping映射文件,完成实验数据与web可访问地址的动态绑定,并以关联数据形式发布,实现实验数据以语义链接为基础的组织、关联、访问及基于SPARQL的科学实验数据检索与定向浏览,同时支持本地实验数据与实验科研成果、作者、相关机构等外部数据的连接访问。本文创新点为以“用户访谈+德尔菲法”为基础,综合运用本体、关联数据多种技术,设计并实现了一种科学实验数据描述模型,用户访谈了解专业领域科学实验数据的组织现状与组织需求,完成科学实验描述方案的初步构建,德尔菲法完成方案性元数据模型的打分、筛选及修正,基于该构建流程的科学数据描述模型能够满足领域用户的现实需求,遵循科研人员的科学数据组织习惯,领域专家的知识支持保证了描述元数据的科学性、专业性。
其他文献
预测是Logistic模型的一个重要功能,文章在研究运用对数回归模型进行预测的问题基础上,进一步对Logistic模型在预测过程的由于模型随机项的非正态性、异方差性而引起的问题进
湿地是重要的自然资源,其污水处理应以节能、环保等为指导思想,所以提倡采用人工湿地污水处理技术。由于人工湿地污水处理技术在我国应用时间不长,对其了解不多。在这里,本文
为了深入研究变长工作面采场顶板的破断特征和垮落形态,以工作面长度由大变小的"刀把式"采场为研究背景,运用弹性薄板理论构建了5种不同支承边界条件下的顶板力学模型,通过理
在全球信息化的今天,信息素质已经成为人们研究、学习以及日常生活的必备条件,信息素质教育的重要性也日益凸显。2000年发布的美国《高等教育信息素质能力标准》[1]已经成为
探析常见的抽油泵失效问题及原因,提出治理措施来延长抽油泵的使用寿命。
在这篇文章中,迪特·格伦诺教授先阐述了服务的本质、范围以及重要性,然后分析了德国公共服务的特点、量化发展趋向以及未来发展所应具备的条件。
最近几年来,高温超导涂层导体在电力、信息、交通等多个应用领域有着巨大的前景,备受关注。其中第一代高温超导带材铋系超导涂层导体(BSCCO)和第二代高温超导带材钇系超导涂层
会计信息外部性的存在使得社会资源配置效率降低,帕累托最优状态无法实现。会计信息外部性包括正外部性和负外部性,现实中会计信息外部性更多地体现在负外部性方面,给会计信息使
《侯爵府纪事》是一部颇具自然主义色彩的长篇小说,是西班牙自然主义女作家帕尔多·巴桑最成功也是影响力最为深远的一部作品。文中融合了法国古典自然主义描写手法与西班牙