论文部分内容阅读
WWW是目前使用最为广泛的Internet信息服务系统,它为用户提供了一个搜索和浏览信息的工具。但WWW是一个信息的海洋,数亿万计的Web文档散布在世界各地的成千上万个Web服务器上,并且每个服务器自主管理自己的资源,没有一个统一的管理机制。总体状况是,整个网络上资源丰富,内容庞杂,很难实现数据的共享,亦不能进行有效地查询。 XML的出现为解决上述问题提供了理想的解决方案。XML全称为ExtensibleMarkup Language,即扩展标记语言,是SGML(Standard Generalized MarkupLanguage)的一个简化的而又严格的子集,它是特别为Web应用设计的,XML是一个在互联网上进行数据交换的理想工具。 由于XML能够使不同来源的结构化的数据很容易地结合在一起,从而使搜索多样的不兼容的数据成为可能,为解决Web查询问题带来了希望。本文围绕着基于XML的Web查询技术涉及到的几个主要问题展开研究与讨论: 1.针对Web上的数据格式差异大、数据来源差别大及当前的数据模型不能很好地描述Web上数据的缺点,研究和探讨了Web上的数据模型——XML数据模型。 2.解决异构数据的集成问题。由于异构数据的集成主要是异构关系数据库中数据的集成。所以本文采用了基于“中间模式”的方法进行数据的集成,将关系数据库中的数据转换为通用的XML格式的数据,从而更好地实现数据的共享。 3.利用XML数据模型在半结构化数据表示和查询方面的优势,通过基于XML的查询语言XML-QL实施Web查询。 在XML出现以前,面向Web的数据查询是一项复杂的技术。通过本文研究的方法,如果采用XML数据模型描述Web上的数据,把不同来源的结构化的数据转换成XML格式的数据,就能够方便地实现数据的共享和进行精确、有效的信息查询,将极大地简化复杂性,提高工作效率。