科学数据网格中基于关键词的信息服务的设计与实现

来源 :中国科学院计算机网络信息中心 | 被引量 : 0次 | 上传用户:xiaomayc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学数据网格在中国科学院科学数据库的基础上,通过数据网格技术,实现对科学数据库中大量分布式异构数据资源的有效共享。科学数据网格中包含大量分布异构的数据资源,如何快速有效的找到用户感兴趣的数据资源,是信息服务系统需要解决的关键问题。信息服务的目标是为用户提供便捷的信息获取方式,快速定位到用户感兴趣的数据资源,并以有效的方式组织和显示这些数据资源。本文在科学数据网格的背景下,针对传统数据网格信息服务的不足,采用新的信息获取技术和方法来研究数据网格信息服务。   本文研究分析了信息获取领域的Web搜索引擎技术和基于关键词的数据库索引技术,在利用和借鉴信息获取技术成果的基础上,结合Web搜索引擎技术和基于关键词的数据库索引技术,设计了数据网格中结构化数据资源的关键词检索发现系统,能够在科学数据网格这种分布式环境中有效地发现和组织数据库中的结构化数据资源。本文工作的重点是分布式数据库中结构化数据的索引机制和技术,并在分析和利用开源全文检索软件包Lucene的基础上,结合科学数据网格信息服务的需求设计和实现了一个原型系统。   本文取得的成果在有关科研项目中得到初步应用,并为进一步研究基于内容检索的科学数据网格信息服务打下一定的基础。  
其他文献
现在空间地理数据越来越丰富,传统企业面临着如何利用这些数据为他们的生产工作中提供服务的问题,而互联网技术在如今社会快速地发展为有效地解决这个问题提供了最基本的技术支
随着网络的飞速发展,尤其是手机、可穿戴式设备等智能终端的迅速普及,用户对网络提出越来越高的要求。现有的网络架构面临着诸多的挑战,例如网络内容急剧增长,信息安全日益突
在中国信息化建设带动下,信息系统工程监理行业从无到有发展起来。软件项目监理是信息系统工程监理中最复杂、最困难的一个部分。关于软件项目监理过程及其支持工具的研究是目
因特网的发展使电子商务、电子政务得到了飞速发展,信息安全问题也逐渐突出。为了解决信息系统的安全问题,上世纪八十年代提出了公钥基础设施(PKI)的概念,依据PKI理论建立起来的
学位
信息时代,当海量数据的存储不再是主要问题时,人们开始将目光转移到数据的集成、融合及语义上来。目前,无论是互联网数据、物联网数据还是本地数据,基本都是被孤立的、分散的存储
在计算机网络中,多媒体实时多播通信是当前研究热点。多播实现了同一信息从源节点到网络中多个目的节点(并不一定是所有节点)的传送。多播问题关键是在于建立一棵满足QOs约束
学位
动态转移预测机制大幅提高了转移预测的正确率。然而,动态转移预测机制中的模式历史表(PatternHistoryTable)表项数目有限,不同的条件转移指令可能映射到同一模式历史表项。如
代数攻击是现代密码学中的一种攻击方法,其主要方法就是利用代数系统的良好性质及求解方法来攻击现存的密码学系统,目前被认为是最具潜力的攻击方法之一。而求解有限域上的多
负载平衡是分布式系统中实现工作量平衡分配,提高系统总体性能的一种关键技术,在实践和理论中已经被证明能够大幅度地提高分布式系统的执行速度、吞吐量和稳定性,在分布式系统中
随着计算机网络技术的飞速发展,多播通信的功能显得越来越重要了。多媒体信息传输的实时性要求计算机网络能够保证传输信息所需的带宽、延迟、延迟抖动、信息丢失率等。已经证
学位