语义Web数据的关键词查询方法

来源 :东南大学 | 被引量 : 0次 | 上传用户:scarab1130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语义Web的不断发展,语义Web数据的数量也在快速增长。无论是应用系统或最终用户,都有着对语义Web数据进行查询的需求。但是,面向语义Web数据的形式化查询语言对于普通用户而言仍然过于复杂。原因在于构造结构化查询不但要求用户了解查询语言的语法和语义,还要求用户必须掌握待查询数据的模式。因此,本文围绕着语义Web数据关键词查询方法开展研究,主要工作包括:   (1)提出了三种面向语义Web数据的关键词查询模型。分别以RDF句子图、r出半径图和实体三元组关联图模型组织语义Web数据,给出不同模型下关键词查询问题的定义。分析了三种语义Web数据组织方式的性质和特点以及数据转换所需要的开销,指出它们各自的适用场景。   (2)提出一种基于RDF句子图的关键词查询方法。将关键词查询结果建模为包括所有查询关键词并且叶节点是关键词节点的无根树。提出一个启发式的关键词查询算法,支持top-k查询。   (3)提出一种基于r出半径图的关键词查询方法。利用r出半径图作为处理单元,利用关键词倒排索引及关系索引来加快实时响应速度。提出一种更合理的评分公式,考虑语义Web数据中关系的流行度,结合文本相关性和关系流行度衡量查询结果与查询关键词之间的相关性。   (4)提出一种基于实体三元组关联图的关键词查询方法(KREAG)。在实体三元组关联图模型基础上,将关键词查询问题转化为关联图上查找有向斯坦纳树问题。在保证近似比为m的前提下(m为查询关键词的个数),利用近似算法实现了快速查询响应。   本文对以上研究内容开展了相应的实验,并与相关工作进行了比较。实验结果表明,本文中提出的概念和方法是合理的,能够快速、有效地解决语义Web数据的关键词查询问题。  
其他文献
半导体技术的进步和应用对计算能力的需求不断促进着体系结构的发展。当前主流的多核处理器,由于其通用性设计,即使将来单芯片集成更多的通用核,也难以满足计算密集型应用的高性
随着多媒体技术和图像采集设备的发展,图像数据以前所未有的速度增长,如何有效地分析、组织和管理这些海量的图像资源,使得基于内容的图像检索系统成为研究的热点。图像检索
近些年来信息技术飞速发展,特别是数据库技术的更新换代,各个领域的数据都出现了爆炸性增长。与此形成鲜明对比的是,从数据中提炼出来的对人们决策有价值的知识却十分匮乏。
随着无线网络越来越普及以及迅速发展,特别是近年发展起来的高速无线宽带多媒体业务,对无线局域网的带宽提出了更高的要求。为了达到网络对高速多媒体业务的支持,IEEE标准化
哲学术语Ontology被借用于信息科学领域源于T.Gruber在1993年给出的定义:"An ontology is an explicit specification of a conceptualization",其中强调“明确的(explicit) "
脑电信号(Electroencephalogram,EEG)中含有能够客观地反映出人近期生理和心理状况的信息,通过对EEG信号进行研究和分析,可以获得大量有用的医学、生理和心理信息,对疾病的治
多年以来,处理器性能的提升主要依赖其工作频率的提高,然而受到芯片功耗及发热等因素的影响,这种做法已接近极限。在这种情况下多核处理器应运而生并得到了迅速发展,与此同时
在计算机图形学中,关于可形变薄壳物体(即曲面)的计算机动画非常常见。自动生成薄壳物体关键帧之间的动画插值是一项应用广泛的任务。动画插值既减轻了艺术家的负担,又大大缩短了
随着云计算的快速发展,作为其重要组成的云存储服务受到了广泛的关注。由于失去对数据的物理控制能力,存储在云端的数据隐私无法得到保证,解决方案之一就是对数据进行加密存
近年来全国连续发生多起重大煤矿安全事故,煤炭安全已成为人们关注的焦点,也是国家重点建设投资项目,且对煤矿安全生产预警、应急救援通信、信息化以及全程的监控网络等提出