连续不确定XML编码及查询技术研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:zhuhande
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着科学技术的进步,数据的处理和采集技术也得到突飞猛进的发展,人们对于不确定性数据的关注也越来越多,在不确定性数据中包含离散的不确定和连续的不确定两种类型的数据。在现实社会中,人们描述信息存在各异性、认知事物具有片面性、数据具有动态变化性和物理器件度量存在的差异性等都会造成不确定性数据的产生。在很多实际应用领域中连续不确定性数据被广泛应用,例如军事、经济、金融、电信和物流等领域。传统的关系型数据库具有结构化的特点,不适用于对不确定性数据的管理。而XML具有易扩展、具有灵活性和可自描述性等优点,使其成为结构化和半结构化数据进行交换、存储的主要数据形式之一,并且特别适用于数据抽取和数据集成等领域。当前XML数据管理技术对于确定性数据的管理已经很成熟,但对于不确定性数据管理的研究还很少。连续不确定性的数据通常采用一个连续的概率密度函数表示,用XML文档来存储连续的概率密度函数就构成了连续不确定XML,如何对其进行管理受到研究者们越来越多的关注。首先,针对已有不确定XML数据的编码方案(区间编码和前缀编码)存在的诸多问题,例如编码过程需要两次遍历文档树、编码值占用的存储空间过大以及不支持更新等。本文提出一种新的基于p-文档模型的素数编码方案CUPE(continuous uncertain prime encoding),编码过程只需一次遍历文档树,重复利用小素数编码,支持文档的更新,克服了以上缺点。其次,考虑基于归并的不确定XML的查询处理算法在匹配过程中需要开辟大量的堆栈,浪费存储空间,查询效率低。提出一种新的非归并的匹配算法CUTwigList,该算法利用节点的编码进行结构关系的判定,判定完成后建立相关链表存储中间结果,匹配过程不需要归并,节省了时间与空间,提高了查询的效率。最后进行了大量的对比实验,在时间性能、空间性能和更新效率方面,将提出的CUPE编码算法分别与区间编码算法、前缀编码算法进行对比;设定不同的查询条件,将提出的非归并的CUTwigList与归并的算法进行对比,并对最终的实验结果进行了详细的分析,证明了所提出的两种算法具有高效性。
其他文献
随着云计算服务的不断丰富,云安全问题也日渐突出,传统一劳永逸的防御措施已难以生效。考虑到主机进程、文件、网络端口等系统资源的信息反映了系统的行为特征,若对云内虚拟主机
随着现在IT技术的飞速发展,视频数据信息提取以用来进行有用信息的检索是一种十分重要的用途。在压缩域下进行运动对象的分割提取中,基于MPEG下的方法是比较成熟的方法,其依据的
在现实世界中,万事万物都有着其特征,这样的特征或多或少、或重要或不重要。人们通过事物的特征可以确定其所属分类,但是当事物的特征都很多时,如果人们依靠传统的方法对事物进行
自20世纪70年代的集散控制系统的出现,传统的工业自动化控制系统出现了结构性的变革,控制系统的网络化成为了新的趋势。以数字串行通信为代表的现场总线标准成为20世纪末工业
随着仿真模型技术的广泛应用,如何提高复杂仿真模型系统的开发效率和降低开发成本问题变得越来越重要。由于系统的复杂性,难于直接开发出满足需求的模型,需要将其分解为子系统,针
大规模函数优化问题有着广阔的应用背景,很多实际应用中的问题都可以抽象成此数学模型解决。进化算法是目前被普遍公认的一种求解函数优化问题行之有效的方法,以其实现简单、求
随着数码产品的普及,人们现在可以随时记录现实生活中的各种场景信息,而普通的数码产品由于受其自身硬件设备的限制,一般无法完全把场景的所有信息记录下来。比如,一个真实场
马铃薯作为我国第四大主粮,对其外部缺陷的检测直接影响到我国马铃薯商品化和深加工进程。由于目前国内大多基于特定环境、特定光照下进行检测,这并不能满足实际环境检测要求。因此,本文提出在开放的自然光环境下对马铃薯主要外部缺陷绿皮、发芽、病斑等的无损检测方法进行研究,这对马铃薯进行深加工和商品化具有重大意义。本文首先针对自然光环境下马铃薯图像的分割方法进行研究,提出一种新的方法分割出马铃薯目标区域。主要先
随着虚拟现实技术的发展,通过这种技术创建一个消防仿真训练系统成为了当今消防训练的趋势。在消防仿真中,火焰的效果直接反应了当前虚拟环境中火灾的发生情况,因此火焰特效是这
体数据在科学模拟、医学影像、石油勘探等领域普遍存在,体数据的可视化也一直是科学计算可视化领域的研究热点。直接体绘制方法因能全面展示体数据的信息、揭示内部特征而备受