面向WEB的XML数据管理技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:enjoy12_east
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web作为一个全球化信息空间,蕴含着具有巨大潜在价值的信息和知识,尽管目前有大量的研究工作关注于Web数据的管理和使用,但是,现有的技术还不能让用户满意.XML为Web提供了一致的数据模型和描述语言,已成为表示Web中多样性数据的事实标准,可以预见Web上的数据将主要以XML形式存在.研究XML数据的管理技术,可以为Web数据的管理提供新的解决途径和方法,对基于Web的应用领域(例如:电子商务、供应链管理、信息检索等)具有重要的应用价值.论文研究了XML数据管理的相关技术,通过分析XML的数据特点,提出一个面向Web的XML数据管理方案,并对其中涉及的关键技术,如存储设计、元数据提取策略、索引技术等方面进行了深入研究,期望对推进本领域的技术发展作一点贡献.论文的主要内容包括如下几个方面:1.提出了一个面向Web的XML数据管理系统WOXDMS的设计方案.针对Web上多样化的数据和多种应用,设计了XML数据引擎,包括XML-关系数据库接口、XML-数据仓库系统接口、XML-面向对象系统接口和XML搜索引擎等四个组成部分,通过这些接口技术,实现了对XML数据的管理,并为Web中各种信息系统之间的信息交流和知识共享提供了接口.2.在分析现有的XML数据的关系存储技术的不足后,该文将系统开销引入XML数据的关系存储设计中,提出了一种基于开销估算的XML数据存储方案.把根据存储开销和查询开销设计数据库模式的方法作为研究XML的关系存储的新思路,改变了以往根据事先设计的固定规则设计关系模式的静态方法.为XML数据在关系数据库系统中的存储提供了一条灵活有效的动态设计方法.3.提出了一种智能的数据模式优化方法.通过人工智能技术中的遗传方法的自适应性和自治性,根据应用需求和系统负载情况,调整数据模式,提高了数据库中模式寻优的自动化程度,为人工智能技术在数据库的应用提供了一个新的切入点.4.提出了一种基于语法规则的XML模式抽取方法.在分析了XML数据语法特点的基础上,采用Chomosky自下向上语法分析的方法,提出了一种下推自动机模型实现信息抽取.这种方法不但能够快速、准确地提取元数据信息,而且容错性强,能够处理不完整XML数据片断.该方法同样适用于类似XML的其它自描述数据的模式获取技术.5.提出了面向Web的XML数据的检索方法.该方法结合文本内容和结构信息,为XML文件设计了增强的索引结构,同时,改进了传统的排序方法和检索方案,提高了查询的精度和查询结果的合理性.
其他文献
目前专家系统推理机的研究分为三类:本地推理机基于本地的知识库进行推理、本地推理机基于网络知识库进行推理和网络推理机基于网络知识库进行推理.随着网络技术的发展以及信
本课题研究了基于API截获的远程实时监测技术。其中,如何实现稳定高效的数据采集、制定功能完备的应用层协议、设计健壮的服务器端软件是关键。本文论证了利用截获Windows API
神经网络作为机器学习的重要方法,在生物信息学领域中取得了广泛的应用,尤其是生物序列的模式分析中,如蛋白质的分类、启动子的识别与分类等等.神经网络也同样被应用于蛋白质
由于应用性的数据的爆炸式增长(如商业分析),及计算机的软硬件技术的发展完备,数据挖掘已经成为近几年来应用最广泛的分析数据的工具。挖掘重要数据仍然需要配合许多其他领域的
随着WebGIS广泛的应用,不可避免地出现地理信息孤岛,特别是在实施数字地球战略计划中,这一问题越来越突出。因此,实现异构地理信息系统之间的数据共享、分布、互操作以及标准化的
汉语分析技术是中文信息处理的基础.目前,汉语词法分析技术已比较成熟,但在词法分析之上的短语分析及句法分析仍然很不成熟.究其原因,主要在于汉语是一种意合语言,语言表达上
轻量级目录访问协议是一种新兴的目录标准。近几年来,随着这种技术的兴起和应用领域的不断扩展,目录服务技术成为许多新型技术实现信息存储、管理和查询的首选方案。随着它的广
远程教育是师生凭借现代信息网络技术与多媒体手段所进行的非面对面的教育。其中网络教育是现代远程教育的一个重要方面,它利用Internet的功能特性和丰富的资源来建立学习环境
随着最高检"科技强检"战略的提出和"213"工程的实施,检务系统信息化工程的实施,为创新办案方式和管理模式,提高办案质量和办案效率,从而逐步实现检务工作与时俱进,顺应全球新