【摘 要】
:
Internet的迅速发展,使其成为全球信息传递和共享的最重要资源,如何利用Internet上的大量信息成为亟待解决的问题.由于Internet上的数据多以半结构或无结构的形式出现,因此传
【机 构】
:
东华大学计算机科学与工程系,上海,200051
论文部分内容阅读
Internet的迅速发展,使其成为全球信息传递和共享的最重要资源,如何利用Internet上的大量信息成为亟待解决的问题.由于Internet上的数据多以半结构或无结构的形式出现,因此传统的数据模式不再适合用来表示这些数据.XML(可扩展标记语言)的出现引起了人们极大的关注,XML是由嵌套的标记元素构成的自描述标记语言,它正在成为Internet上数据表示和交换的主要标准.与HTML相比,XML具有很大的灵活性,不但可以表示无结构的文本信息,也可以表示高度结构化的数据,它极大地推动了互联网技术在电子商务、电子数据交换和电子图书馆等多方面的应用.因此,对于如何有效地存储、管理和查询这类数据成为研究的热点,但是已有的数据库技术,都不能完全适应于存储XML数据,而专用的XML数据管理系统的研究目前仍处于起步阶段.在本文中,作者通过分析比较现有的XML数据存储方法,提出了一种新型的XML数据存储模式:把XML文档中的元素和元素之间的关系分开存储,以便于对XML文档的管理和查询.本文首先介绍了XML文档的逻辑结构及研究现状,然后介绍了新的XML存储模式,最后对存储策略进行分析及优化。
其他文献
4.逐步实现相关功能致力于开发下一代互联网电视的日本生产商目前大多仍处于第一阶段。多家公司正在开发能够灵活处理视频流的执行环境,其中包括索尼公司的APPlicast、松下公
WWW上产生的海量XML数据已经成为现有关系数据库管理系统(RDBMS)的一个巨大挑战.由于传统的RDBMS主要为结构化的二维表数据而设计,因此它们很难胜任许多基于XML的、半结构化
关联规则挖掘是数据挖掘的重要研究课题,近年来得到了广泛的重视和研究.一个关于关联规则的典型的例子是它在购物篮分析中的应用.本文采取“分而治之”的策略,提出了一种挖掘
文章介绍了会展业的定义及其发展历程,阐述会展业在促进经济发展、带动社会就业、提高城市知名度等方面的积极作用。
This article introduces the definition of MICE indu
文本分类是处理和组织大量文本数据的关键技术,它一直是信息检索领域中的一个研究热点.文本分类旨在将大量文本划分为若干子类,使得各文本子类代表不同的概念主题.文本分类技
分类是一种重要的数据分析形式。目前,已经有许多种分类方法,但其中大部分都是内存驻留算法,通常假定数据量很小。随着数据库中数据量和维数越来越大,建立高效的、适用于大型数据
随着Internet的飞速发展,基于Web平台的各种应用受到了广泛的欢迎,基于Web平台的电子商务得到了空前的发展.对于一个电子商务网站来说,其拓扑结构蕴含了各个页面之间的关联关
网络上信息量的剧增,给网站的管理和用户的浏览带来一系列的难题.Web个性化技术,即Web站点根据用户的需求为其提供一对一的服务的技术,正是针对这些难题的解决应运而生的.目
神经网络和遗传算法的结合是当前智能技术研究的重要内容,也是计算智能CI技术的重要组成部分。本文在分析BP算法和遗传算法机理之后,提出了一种遗传BP神经网络数据挖掘技术。由
关联规则是由Agrawal等人首先提出的一个重要的KDD研究课题,它反映了大量数据中项目集之间有趣的关联或相关联系.发现频繁项目集是关联规则挖掘应用中的关键技术和步骤.近年