【摘 要】
:
如今,随着知识图谱的兴起,越来越多的数据集采用资源描述框架(RDF)的格式发布和维护数据,由于RDF数据天然的图结构模型,可以将SPARQL检索RDF数据问题转换为大图上的子图匹配问题。大量RDF数据的发布,使得利用SPARQL查询进行RDF数据的检索超出了单机处理能力的限制,基于分布式的图匹配方法日益受到关注。在分布式RDF查询处理中,由于查询图的规模与复杂度的不断增长,其复杂的结构使得查询优化
论文部分内容阅读
如今,随着知识图谱的兴起,越来越多的数据集采用资源描述框架(RDF)的格式发布和维护数据,由于RDF数据天然的图结构模型,可以将SPARQL检索RDF数据问题转换为大图上的子图匹配问题。大量RDF数据的发布,使得利用SPARQL查询进行RDF数据的检索超出了单机处理能力的限制,基于分布式的图匹配方法日益受到关注。在分布式RDF查询处理中,由于查询图的规模与复杂度的不断增长,其复杂的结构使得查询优化面临着查询准确性和性能的双重挑战。针对以上问题,本文通过比较当前主流的分布式RDF图查询优化方案的优缺点,经过理论分析与实验验证,提出了一种由结构主导的分布式子图匹配优化方法。本课题研究期间的主要工作如下:首先,对于数据进行预处理。通过Jena2将OWL本体数据集进行数据抽取处理,得到便于处理的NT格式的RDF元数据,利用字典编码技术将冗长的元数据信息以整数id形式进行压缩存储;提出了本文的摘要统计图模式,利用基于类型的数据统计方式对本文提出的代价模型计算所需要的相关数据进行预收集与统计;提出了针对图探索策略所制定的数据图的分区方式及基于内存的数据存储索引结构,将压缩之后的整形三元组数据依据整形id进行hash分区划分,各计算节点对所分配到的数据片段基于底层的Key-Value对结构进行索引存储并通过建立虚拟的类型/谓词节点进行倒排索引,加速查询。然后,对于查询图进行处理,分解查询图结构以及制定查询计划。提出了查询图的CPM节点分解模型,以充分利用查询图中各部分结构在分布式环境中的匹配特点,加速查询;提出了以节点为核心的代价模型,在通过摘要统计数据进行计算得到的加权查询结构图上,结合最小生成树思想将复杂的图探索问题转化为查询执行树问题,得到高效的查询执行序列。最后,将查询计划传递到每一个计算节点,在所有计算节点上利用图探索模式开始匹配任务。提出了推迟笛卡尔积操作的优化策略,来压缩核结构匹配时包含全历史信息的路径数目;提出了利用结构分解将匹配过程分割的策略,使得路径结构匹配过程可以无冗余地高速并行执行,并在主机上进行轻量级的连接得到最终匹配结果。
其他文献
随着金属铝需求量的增加和优质铝土矿资源量的减少,高硫铝土矿资源的开发利用得到更多的重视,为提高高硫铝土矿资源的利用率,保障我国铝土矿产业的可持续发展,应不断加强对高
本试验主要研究不同浓度镉(Cd)对齐口裂腹鱼氧化胁迫及脂质代谢相关基因表达的影响,同时研究酸解氧化魔芋葡甘露聚糖(AOKGM)的干预效果。试验设计:齐口裂腹鱼日粮中添加0%(Cd
帽形件板材是一种经济断面型材,具有结构强度高、经济效益高、能源消耗低等特点,广泛应用于汽车、航空、建筑及民用等行业,其典型成形工艺为辊弯成形。现阶段,辊弯技术多为单纯依靠生产经验随意分配每道次的辊弯成形角度,缺乏划分成形角度科学理论指导,从而成形过程中往往出现翘曲、回弹等缺陷,降低产品的成形精度与成形质量。本文以工业生产中常见的小断面型材帽形件作为研究对象,提出一种五边界条件成形角度分配函数,用于
漆酶(Laccase,EC 1.10.3.2)是一种含铜的多酚氧化酶,具有作用底物广泛、产物无污染等优点,在食品制造、纺织印染、生物传感器等领域均具有极佳的应用潜力。漆酶同工酶LACC2和LA
土壤溶解性有机质(DOM)是土壤有机质中最活跃的部分,可吸附或络合重金属,形成螯合物。土壤DOM的异质性和其组成化学结构的变化导致DOM与重金属的络合能力差异较大,从而影响土
酱油是以大豆、麦麸等为原材料酿造而成的一种传统发酵调味品和潜在功能性食品。酱油中的代谢产物不仅使酱油具有独特的风味,还拥有丰富的营养,是影响酱油品质的重要因素。目
根系生长冗余现象是作物生态与系统进化领域中的基础科学问题。根系大小及构型对旱地小麦生长、水分利用、生物量分配和产量形成具有重要影响,前期研究对该现象做了初步探索,
利用机器视觉技术识别紫色土具有重大意义。一幅紫色土彩色图像的背景可能十分复杂,往往包含绿色植被、地表土壤等杂质,将对紫色土的识别有严重的干扰。因此,将土壤图像目标物-土壤区域从土壤图像中提取出来,可以避免背景干扰。本文针对紫色土区域图像提取做了如下工作:(1)根据紫色土彩色图像土壤区域在Lab颜色空间中的a分量下具有较好的聚集特性,改进密度峰值聚类算法用于紫色土彩色图像初分割。首先利用a分量中每个
在金融、生物学和社会学的许多应用中,许多重要问题都可以建模为一个相互关联的复杂的实体系统,其中每个实体都记录着与时间相关的观察值或测量数据。为了发现趋势、检测异常
农民是农田的拥有者,同时又是开展农田土壤修复的具体实施者,其对农田修复技术的选择行为决定土壤修复技术能否大规模应用。基于此,本文以中国4个典型污染耕地土壤修复项目区为研究案例,从农户个人特征、家庭及生产特征、技术特征和政策感知等方面分析农民对修复技术的选择意愿及影响因素;基于选择实验法,探究农户选择行为的影响因素。从农田拥有者或实际经营者的角度分析影响农田土壤修复技术推广应用的关键因素,为农用地土