XML数据的规范化存储

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:yclmq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML(eXtensible Markup Language)作为一种Internet上的主要的数据表示和交换标准,应用范围非常广,这就对XML数据库的模式提出了更高的要求。和关系数据库类似,如果XML数据模式设计的不好,就会引起插入、删除和更新等异常,由于Web的开放性,XML数据异常的危害性往往远大于关系数据库异常的危害性。XML数据已经成为Internet上的主流数据,虽然现有的研究在存储与发布、查询与优化等技术方面已取得一定的成果,特别是与关系数据的转换技术已相对成熟,但大部分理论仅仅考虑将XML文档数据转换到关系数据,且这种转换只是保持了结构信息,而没有从数据库设计的角度来评价XML数据库模式;另外,部分已有的研究虽然提出了相关的XML范式,但定义的理论仍然存在不完善和欠缺,这必将对今后的Web数据处理带来很大的麻烦,势必造成网络数据大量冗余和不一致的现象。本文从数据库的角度出发,以XML键为中心结合函数依赖FD和多值依赖MVD描述XML数据间的约束;基于主键、副键分析不同情况下的数据冗余,给出相应的规范化规则;并由此定义不同的范式和规范化算法;最后提出一种新的基于键的XML模式到关系模式的转换算法。主要的研究成果如下:●对XML函数依赖约束进一步研究:基于本文的符号理论体系给出XML函数依赖、部分函数依赖、传递函数依赖的概念;定义了XML函数依赖的逻辑蕴涵与覆盖,并给出相应的推理规则和消解规则,得到无冗余的极小函数依赖集;最后给出有效性证明;●参考已有的XML多值依赖定义和XML多值依赖推理规则,给出基于本文符号理论体系的MVD相关的形式化定义;●讨论XML中的键约束,仿照关系数据库中键的概念,以集合的形式给出XML主键和副键的定义,基于键讨论了XML数据冗余,分别定义为“主键无关的冗余”和“副键无关的冗余”;●针对数据冗余的不同情况定义不同的XML范式,并给出消除数据冗余的相应规则;在范式定义和规范化规则的基础上给出XML文档的规范化算法,并给出算法分析和证明;●提出一种新的XML模式到关系模式的规范化转换算法,该算法基于本文所定义的XML键,包括主键、副键及隐键,结合函数依赖的约束,尽量减少属性节点的冗余,使得到的关系模式中的关系表及其属性更加合理。
其他文献
作为无线ad hoc网络的延伸,自2002年以来无线Mesh网络以其组网简单、方便、可扩展,无线多跳,健壮性高,结构灵活,高带宽和干扰较小等诸多优点备受研究人员的关注。至今,已有大
网络教学是现代教育的重要手段,它创造了数字化的学习环境,促进了教育观念、教学内容和方法的改革,提高了教育教学的质量和效益,促进了教育事业的发展。本文描述了中职学校网
随着网络技术的发展,互联网已经深入了我们的日常生活。很多事情都可以通过网络来实现,而现在的人们也越来越倾向于利用网络来完成各种各样的任务。随着电子商务的不断发展,
计算机辅助教学(CAI)是现代教育技术的重要组成部分。通过CAI软件辅助教师的教学过程和学生与计算机之间的交互式活动,可以帮助学生学习知识、掌握方法,帮助教师改进教学方法
本文研究了基于平衡计分卡和贝叶斯网络的智能化战略决策模型系统,提出了基于BSC—BN的战略决策模型,该模型系统将当今管理学上非常热门的“平衡计分卡”理论进行了软件实现,
随着世界经济和国际贸易的发展,民用航空运输业将会迅速发展,与此同时,随着人民生活水平的提高,人们对民航信息服务质量的要求也越来越高。因此,民航信息化问题的研究对于加速民航
现代人体科学证明,健身对保障人的身心健康具有不可替代的作用。健身锻炼不仅能提高身体的基本活动能力,还能够愉悦身心、缓解人们的生活、工作压力,增强人的身心健康。在工作和
铁路运输在企业物流环节具有十分重要的地位,肩负着保障生产的重任。长期以来我国企业铁路运输作业大多以人工调度为主,导致调度作业效率低下,物流运输不及时,随着经济的发展
时间是自然界无所不在的客观属性,所有信息都具有相应的时态属性。时态数据库将时间作为数据的属性纳入系统的管理范畴,存储和管理多个时间状态的数据。时态数据库中存储的数
生产调度是制造车间生产管理的重要内容,在考虑材料、设备、人员等约束条件下,合理安排产品在机器上加工,以达到优化调度指标的目的。柔性作业车间分批调度问题是现阶段最贴近实际的车间调度模型,成为人们追求求解的热点。柔性作业车间分批调度问题中工件的分批和分批后的工序安排是两个重要的模块。本文针对这两个问题,给予优化求解,主要内容包括以下几点:(1)针对现阶段在柔性作业车间分批调度模型没有考虑车间工件工序加