基于BSP的SPARQL基本图模式查询

来源 :天津大学 | 被引量 : 0次 | 上传用户：tianzhiyou258

【摘要】

：

随着语义网的不断发展以及开放链接运动深入展开，发布在互联网上的RDF数据不仅已达到百亿级三元组规模，而且呈现出几何增长的趋势。有效的管理和查询这些RDF数据，正显得日益重要

【作者】

：

李国鼎

【机构】

：

天津大学

【出处】

：

天津大学

【发表日期】

：

2014年期

【关键词】

：

语义网资源描述框架 SPARQL查询基本图模式 BSP模型 HAMA框架

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着语义网的不断发展以及开放链接运动深入展开，发布在互联网上的RDF数据不仅已达到百亿级三元组规模，而且呈现出几何增长的趋势。有效的管理和查询这些RDF数据，正显得日益重要。传统的单机上针对RDF数据的SPARQL基本图模式查询算法，不能满足RDF数据日益增长的需求。而基于MapReduce分布式计算模型的SPARQL基本图模式查询方法，不能够充分发挥分布式计算的潜力，并行度有待提高。针对该问题，本文提出了一种基于BSP模型的SPARQL基本图模式算法。根据RDF数据是有向图数据的特性以及基本图模式的定义，把整个查询过程分成“匹配”和“迭代”两个阶段，先匹配出每个要查询的三元组模式，然后通过迭代让部分解逐步逼近完全解，最后得到查询结果。根据本文提出的基于BSP模型的SPARQL基本图模式算法，设计并实现了一个SPARQL查询机原型。该SPARQL查询机原型的查询引擎部分采用BSP模型分布式计算框架——HAMA实现。在数据持久层，该SPARQL查询原型机中引入了基于Cassandra数据库存储RDF图数据，以满足RDF数据能够得到有效管理和快速加载的需要。此外，还设计了针对本文提出的基于BSP模型的SPARQL基本图模式算法的特有的缓存机制，提高查询速度。在实验部分，与前人提出的基于MapReduce模型的SPARQL基本图模式算法的查询时间对比实验。实验结果表明，本文提出的基于BSP模型的SPARQL基本图模式算法查询效率得到提升。总的来说，本文提出的基于BSP模型的SPARQL基本图模式算法充分利用了BSP模型的消息机制，相对前人提出的基于MapReduce模型SPARQL基本图模式算法，在并行度上更优。从而可以为大规模RDF数据的快速SPARQL查询提供支持。

其他文献

基于云计算的档案信息管理系统的研究与实现

伴随计算机技术的发展，许多新思路、新技术不断介入传统信息管理领域，导致这些领域从数据的积聚到信息管理的形式等诸多方面发生了剧变。本文结合作者多年的具体的档案工作经验

学位

档案信息管理系统云计算技术分布式检索服务模式

基于用户独立模型的生理情感识别

由于生理信号在情感识别中的优势，基于生理信号的情感识别的研究成果已经在人机交互、教育、医疗护理等方面得到应用。用户依赖的情感识别系统已能达到令人满意的结果。然而，实

学位

情感识别生理信号用户独立模型特征选择

引入领域知识的词语语义相似度研究

语义相似度是人工智能、信息检索、文本分类、机器翻译、词义排岐、自动问答和句法分析等领域的基本问题，有着广泛的应用，具有理论的研究价值和应用前景。词语相似度计算是句子

学位

信息处理《知网》词语相似度敏感词集领域知识

用于增强现实的实时深度图像三维人体识别及遮挡处理

本文实现了用于增强现实的实时深度图像三维人体识别与遮挡处理算法ˋ使用单帧深度信息图像与深度信息视频流ˋ专门针对增强现实领域的突出问题ˋ提出了创新性的深度图像人体

学位

增强现实深度图像人体识别遮挡处理

基于日志挖掘的IETM数据模块推荐模型研究

随着现代化设备及武器装备的不断发展，其所含信息量也日趋庞大，而针对这一现象应运而生的IETM也在各行各业不断的普及，所以IETM如何按照人们需求不断发展，IETM使用者的工作效率如

学位

IETM数据模块日志挖掘推荐

OBS网络中基于突发包分割的光缓存方法研究

随着电子科技技术和网络的迅猛发展，以及数据业务量的急剧增长，这就要求越来越高和越来越新的网络技术，由于电信号和现有传输介质的物理性质的局限性，传统网络技术潜力有限，光传输

学位

光网络光突发交换分割光缓存

多变量体数据的压缩技术研究

近几年来，随着移动计算和传感器设备的迅速发展，高维度多变量数据日益增多，例如互联网企业巨头阿里巴巴专注于电子商务多年，积累了海量的文本、视频类高维多变量数据，蕴含着巨大的

学位

多变量体数据体数据压缩小波变换彩色空间主动学习半监督学习

基于启发式规则和阶乘码的零等待流水车间调度算法研究

零等待流水车间广泛的存在与现代制造系统中,如钢铁、医药等制造系统。在零等待流水车间中,假设有n个工件被m台机器加工。各个工件由z个工序组成,每个工序与机器是一一对应的,即一种机器只能加工一种工序,一个工序只能在一台机器上进行加工。一个工件的连续两道加工工序不能出现中断。一台机器不能同时加工多个工件。因此零等待流水车间调度算是一个典型的NP-hard问题。已有的调度策略和传统的调度方法已无法满足实际

学位

零等待流水车间调度傅里叶变换拼图算法阶乘码

基于3G网络的车载多媒体系统的控制与管理

目前伴随着3G通信、无线网络等技术的飞速发展,车载多媒体系统在广告、娱乐等方面应用日益广泛。车载终端设备作为车载多媒体技术的载体与3G无线网络通信甚至与互联网的结合

学位

车载多媒体系统3G网络终端设备控制模型异常检测

变电站巡检机器人控制系统设计与实现

论文设计并实现了一种应用于变电站环境下，解决变电站无人值守化的移动巡检机器人控制系统。在本论文中主要讨论了移动机器人的设计建模、控制、算法以及部分相关的硬件设计策

学位

巡检机器人自主巡检动态AVL树变电站控制系统

基于BSP的SPARQL基本图模式查询

其他学术论文