基于RDF的云制造资源数据存储及检索方法的研究与实现

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:heck502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语义网技术的不断发展与成熟,资源描述框架RDF (Resource Description Framework)被应用于越来越多的领域中,然而随着全球全面进入信息化,数据爆炸式的增长,大规模RDF数据的存储及检索成为行业数据整合和数据分析的关键技术,如何提高RDF数据存储的可扩展性、数据检索的高效性对于目前web服务管理、数据管理、云计算及行业数据共享及整合具有重要的现实意义。首先,本文对RDF数据的存储方法进行了比较,针对传统的关系数据库技术难以应对海量数据存储问题,提出基于Hbase的RDF存储方案,存储方案中表的逻辑存储结构采用动态列存储数据,使其可以在处理RDF可能出现的多值问题时具有更高的效率。然后,本文针对传统基于关键字的查询无法得到全面准确信息的问题,对RDF查询语言——SPARQL与HBase之间的查询接口进行了研究与设计。提出了语义扩展的查询方法及核心算法。实现了基于语义与基于关键字相结合的查询。再次,针对传统的数据集中式处理方式难以应对快速信息检索问题,本文在查询逻辑之上增加了索引机制以及并行查询机制对查询效率进行了优化。引入索引机制可以减少查询时所要遍历的节点数,引入并行化查询可以使一条查询在各节点之间并行进行查询,从而提高查询效率。最后,本文通过对比试验,对无索引与并行机制的查询方案与有索引与并行机制的查询方案进行了对比;并对实验结果进行分析,证明在数据量较大的情况下,有索引与并行机制的查询方案要优于无索引与并行机制的查询方案。
其他文献
智能信息处理是计算机科学与技术领域的重要研究内容之一,而在智能信息处理过程中,人们会遇到许多的不确定性信息。作为一种典型的不确定性信息,二维模糊语言信息不仅可以刻画评
随着高维数据库的快速发展,高维数据库容量越来越大,为加快查询效率,研究者已提出了多种对高维数据建立索引结构的方法,但是这些索引结构在如下两个方面存在着缺陷:一方面,这
电子商务的广义概念是指通过电子方式的所有活动或者各种企业往来,其中最重要的电子方式就是互联网。如今电子商务的销售总额相当于前几年的电子商务销售额的总和,尤其在购物
在当今网络高度普及的信息化时代下,越来越多的高校都建立了自己的门户网站,以便对外宣传、服务及展示自我。高校的门户网站处于互联网这个开放的环境中,在给师生们提供便利的信
在人类认识世界的过程中,人们会不断地接受新的知识,随即人们的认知状态也会发生改变,有时人们遇到的某些新知识会与原来的知识发生矛盾,这时就要对已有的知识库进行更新。如
传统的学习算法都是批量学习算法,即假设一次性获得所有样本,或者获得有代表性的样本,然后用其对分类器进行训练。但在实际的生活中,要一次性获得所有样本,或者获得有代表性的样本
学位
进化算法(EAs,EvolutionaryAlgorithms)由于其具有隐并行性及强鲁棒性等特性,被广泛应用于解决单/多目标优化问题。但在进化过程中,进化算法需要对候选解进行大量的目标函数值评
带宽是互联网通信中的关键因素与重要资源,在互联网规模和网络使用者的日益增多、业务种类逐渐多样化的今天,为了能够获得更好的网络运行环境,网络运营商需要提供更加可靠的
如今已步入云计算时代,云环境下的数据访问离不开数据库的支持,一个性能优良的数据库系统可以极大地提升云平台数据访问速度。目前很多云平台使用的数据库都是集群形式,这主要有以下原因。首先,数据库集群往往都实现负了载均衡的功能。其次,因为集群中包含了不止一个数据节点,大大提高了数据的安全性。此外,当集群中某个节点无法继续执行任务时,可以将该任务分给其他的节点去执行,实现失败转移。可以看出,数据库集群具备了
学位