关系—XML双引擎数据库CoSQL RX关键字检索模块的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:qwe6367
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库的关键字检索算法能够提供一种像信息检索一样简单的接口,输入想要查询的关键词,即可返回所需要的数据;掌握一门结构化查询语言成本太高,关键字检索大大降低了使用数据库的门槛。关系数据和XML数据在企业数据管理过程中相互依存、互为补充,关系-XML双引擎数据的关键字检索面临着明确的应用驱动。对数据库关键字检索的研究是一个有价值且热门的话题,但目前并没有一个完善的设计可以解决关系-XML数据的关键字检索问题。  因此,本文基于北京大学数据库与信息系统研究室的承担的“863”课题《无缝集成的关系-XML双引擎数据库管理系统研制及其示范应用》和“核高基”重大专项《大型通用数据库管理系统与套件研发及产业化》下的课题《XML数据管理技术研究与开发》,为关系-XML双引擎数据库CoSQL RX设计了关键字检索模块,并辅以大量的实验验证了该方法的准确性和有效性。本文主要研究内容包括:  本文在CoSQL RX数据库系统中设计并实现了关键字检索模块,支持关系-XML双引擎数据的关键字检索。该模块主要包含索引管理、关键字检索算法和查询结果的排序三大部分。用户输入想要查询的关键字,即可返回包含所有关键字的RX-最小生成树。  在CoSQL RX数据库系统中关系-XML数据存储结构的基础上,设计了支持关系-XML双引擎数据的二级倒排索引结构,降低了内存的占用率。  提出了RX-关键字检索算法,支持关系-XML双引擎数据的关键字检索。首先在元组数据图中找到包含所有关键字的最小生成树;若节点中包含关键字的列属于XML数据类型,则需要在该XML数据中找到包含关键字的SLCA节点。最后,返回RX-最小生成树。  提出了Backward-TopK算法,提高了在元组数据图中计算最小生成树的效率。  
其他文献
隐写术是信息隐藏领域用来秘密传递消息的一种技术,嵌入效率更高的隐写算法具有更好的安全性,而矩阵嵌入是一种用来提高隐写算法嵌入效率的有效方法。在进行矩阵嵌入前,通信双方
文本是存储和交换信息的最自然的方式,但是,随着信息时代的高速发展,文本的数量呈指数级增长,因此,如何迅速的从海量文本中获取信息就成为了一个具有挑战性的问题。  文本分类技
随着Web2.0时代的到来,Web技术高速发展,网站渐渐由原本的静态文档发展成为具有各种强大功能的动态页面。互联网用户可以通过网站轻松的完成很多业务。然而由于大量的个人信
近几年,随着移动互联网的飞速发展,智能手机终端和移动操作系统都取得了长足的进步,智能手机终端遍地开花,移动操作系统如iOS,Android等都取得了巨大的成功,拥有大量的用户量。在移
动画电影逐渐成为银幕上一种被人们普遍接受的艺术娱乐形式,其画面往往包含多种不同风格的对象,卡通对象和水墨画相交融的场景更是经常出现,因此,如何有效地实现不同艺术风格
随着各类移动终端的普及,对高带宽业务的需求也日趋明显,对互联网的数据传输能力也提出了更高的要求。提高网络传输效率的方法很多,但如何适当的降低文件的冗余度,提高文件的利用
随着计算机网络技术的不断发展,WEB网站包含的内容已经涉及到人类生活的各个方面,给人们带来了极大的便利。其中,商品交易类型的网站因其带来的巨大利益而迅速发展,但是在艺术品
基于照片序列的三维重建是指从多个角度对一个现实三维场景拍摄照片,并从中恢复出场景的三维模型和表面纹理的技术。这是计算机视觉和图形学领域一个近年来非常热门的研究领域
随着城市化进程的快速发展,汽车数量急剧增长,而许多城市道路建设滞后,这样便会导致城市交通拥堵,交通事故频繁以及环境污染等问题日益突出。近年来,为了缓解这些问题,智能交通系统
互联网应用的日益普及化和云计算的浪潮,给我们的生活中带来了非常多的高效网络应用,其中就包括云存储类应用,使得无附加硬件化的备份服务得到了实现。在云存储网络备份应用得到