基于BSP的SPARQL基本图模式查询

来源 :天津大学 | 被引量 : 0次 | 上传用户:tianzhiyou258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语义网的不断发展以及开放链接运动深入展开,发布在互联网上的RDF数据不仅已达到百亿级三元组规模,而且呈现出几何增长的趋势。有效的管理和查询这些RDF数据,正显得日益重要。传统的单机上针对RDF数据的SPARQL基本图模式查询算法,不能满足RDF数据日益增长的需求。而基于MapReduce分布式计算模型的SPARQL基本图模式查询方法,不能够充分发挥分布式计算的潜力,并行度有待提高。针对该问题,本文提出了一种基于BSP模型的SPARQL基本图模式算法。根据RDF数据是有向图数据的特性以及基本图模式的定义,把整个查询过程分成“匹配”和“迭代”两个阶段,先匹配出每个要查询的三元组模式,然后通过迭代让部分解逐步逼近完全解,最后得到查询结果。根据本文提出的基于BSP模型的SPARQL基本图模式算法,设计并实现了一个SPARQL查询机原型。该SPARQL查询机原型的查询引擎部分采用BSP模型分布式计算框架——HAMA实现。在数据持久层,该SPARQL查询原型机中引入了基于Cassandra数据库存储RDF图数据,以满足RDF数据能够得到有效管理和快速加载的需要。此外,还设计了针对本文提出的基于BSP模型的SPARQL基本图模式算法的特有的缓存机制,提高查询速度。在实验部分,与前人提出的基于MapReduce模型的SPARQL基本图模式算法的查询时间对比实验。实验结果表明,本文提出的基于BSP模型的SPARQL基本图模式算法查询效率得到提升。总的来说,本文提出的基于BSP模型的SPARQL基本图模式算法充分利用了BSP模型的消息机制,相对前人提出的基于MapReduce模型SPARQL基本图模式算法,在并行度上更优。从而可以为大规模RDF数据的快速SPARQL查询提供支持。
其他文献
伴随计算机技术的发展,许多新思路、新技术不断介入传统信息管理领域,导致这些领域从数据的积聚到信息管理的形式等诸多方面发生了剧变。本文结合作者多年的具体的档案工作经验
由于生理信号在情感识别中的优势,基于生理信号的情感识别的研究成果已经在人机交互、教育、医疗护理等方面得到应用。用户依赖的情感识别系统已能达到令人满意的结果。然而,实
语义相似度是人工智能、信息检索、文本分类、机器翻译、词义排岐、自动问答和句法分析等领域的基本问题,有着广泛的应用,具有理论的研究价值和应用前景。词语相似度计算是句子
本文实现了用于增强现实的实时深度图像三维人体识别与遮挡处理算法ˋ使用单帧深度信息图像与深度信息视频流ˋ专门针对增强现实领域的突出问题ˋ提出了创新性的深度图像人体
随着现代化设备及武器装备的不断发展,其所含信息量也日趋庞大,而针对这一现象应运而生的IETM也在各行各业不断的普及,所以IETM如何按照人们需求不断发展,IETM使用者的工作效率如
随着电子科技技术和网络的迅猛发展,以及数据业务量的急剧增长,这就要求越来越高和越来越新的网络技术,由于电信号和现有传输介质的物理性质的局限性,传统网络技术潜力有限,光传输
近几年来,随着移动计算和传感器设备的迅速发展,高维度多变量数据日益增多,例如互联网企业巨头阿里巴巴专注于电子商务多年,积累了海量的文本、视频类高维多变量数据,蕴含着巨大的
零等待流水车间广泛的存在与现代制造系统中,如钢铁、医药等制造系统。在零等待流水车间中,假设有n个工件被m台机器加工。各个工件由z个工序组成,每个工序与机器是一一对应的,即一种机器只能加工一种工序,一个工序只能在一台机器上进行加工。一个工件的连续两道加工工序不能出现中断。一台机器不能同时加工多个工件。因此零等待流水车间调度算是一个典型的NP-hard问题。已有的调度策略和传统的调度方法已无法满足实际
目前伴随着3G通信、无线网络等技术的飞速发展,车载多媒体系统在广告、娱乐等方面应用日益广泛。车载终端设备作为车载多媒体技术的载体与3G无线网络通信甚至与互联网的结合
论文设计并实现了一种应用于变电站环境下,解决变电站无人值守化的移动巡检机器人控制系统。在本论文中主要讨论了移动机器人的设计建模、控制、算法以及部分相关的硬件设计策