WEB信息集成技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:huangzhijian2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
WEB 如同一个庞大的知识库,但其中的知识纷繁复杂、浩如烟海难以使用。WEB 信息集成技术能够对凌乱的WEB 页面进行分析、筛选、集成,为人们提供一个统一的知识视图和访问方式,从而实现对WEB 资源的高效利用。目前的WEB 信息集成技术还很不成熟,尤其是缺乏自动性和智能性。我们将领域本体引入到WEB 集成中,基于领域本体在WEB 信息集成的自动性和智能性方面作了一系列成功的尝试,并提出了完整的解决方案。我们回顾了信息集成系统的发展历程,总结了信息集成的基本原理和经典方法;阐述了WEB 信息集成的功能要求和经典体系结构以及现有的各个功能部分的实现方案;通过与传统信息集成的对比,分析了WEB 信息集成系统的新特点、新需求和关键技术。阐述了本体的基本理论、功能和表示方法,特别分析了利用领域本体进行知识表示、知识匹配的具体方法。为了实现信息集成系统及其构建过程的自动化和智能化,我们为其引入了领域本体。在领域本体的基础上对传统的Mediator/Wrapper 体系结构作了相应的改进,并为一些功能模块设计了新的实现方法。采用RDF 表示本体,设计了领域本体的多文件、树状的存储和访问方法并实现了基于领域本体的知识匹配算法;设计了基于领域本体和XML 的数据源描述方法,并实现了数据源分析和数据源描述生成的自动化;设计了基于领域本体的查询重写、查询分解、查询优化和查询结果处理等一系列的智能化查询处理方法;对于动态WEB 数据源,采用类似于服务的描述和访问方式从而实现了动态数据源的集成。基于本体的WEB 信息集成系统的集成对象将不再是特定的某些数据源,而是随其所用的本体的变化而动态变化的,拥有某一领域的本体就可以集成该领域的数据源,拥有多个领域本体则可以进行跨领域集成。采用上述方法,设计并实现了一个原型系统。对该原型系统进行了充分的查询测试,在查准率、查全率、响应时间和跨数据源查询等方面均得到了不错的性能数据。这也证明了我们的基于本体的WEB 信息集成技术的解决方案的正确性和有效性。
其他文献
论文介绍和总结了网格计算中的关键技术——资源分配和任务调度以及网格QoS的国内外研究现状,指出了目前研究中存在的问题和不足,并就这两方面的结合,即如何在资源分配和任务调
近年来,随着软件技术和internet的迅猛发展和普及,企业级计算达到了前所未有的新高潮。无论是从事电子商务的新兴企业,还是从事传统产业的企业,都需要互联网来发展和拓展企业。总
发音运动可视化是指将人的发音过程通过三维模型模拟出来。发音运动分析与合成系统涉及生理语音学、语音生理图像、人的发音机制及控制的生理计算模型等领域的相关技术,主要方法是建立超声数据库与三维生理模型数据库并将在二者之间建立映射关系从而实现发音运动的可视化,建立一个完善的发音运动分析与合成系统。目前,在对中文发音可视化研究方面存在欠缺,尤其是通过三维模型的可视化方面,因此发音运动分析与合成系统在语言学习
随着国民经济的高速发展以及市场经济体制的确立,电能已经作为一种特殊的商品越来越受到大家的重视。自20世纪70年代以来,由于电力电子器件及其它非线性负荷在电网中大量的投
随着Internet在全世界的迅速发展,以其为载体的应用也越来越多。近年来,流媒体的应用在Internet上得到了迅速的推广,这就带来了网络带宽的急剧消耗和网络拥塞问题,需要一种行之有
人脸识别技术,是生物识别技术中一个非常重要的领域。这一技术有着广阔的应用前景和迫切的现实需求。但由于人脸模式的多样性和图像获取过程中的不确定性都导致人脸的检测和
当前Web应用系统的性能已经成为人们关注的焦点。由于手工测试存在致命的缺点,性能测试工具得以广泛应用。这类工具普遍在HTTP/S等多种协议基础上,创建并执行虚拟用户脚本,以
大脑对于语音产生的控制过程是非常复杂的,包括许多的神经控制过程如语音规划、听觉感知反馈和体感感知反馈等。在控制过程中,各个相关的脑区是协同和并行工作的,一个区域的
网格计算是近年来的研究热点之一。它可将高速互联网、电脑、大型资料库、传感器、远端设备等融为一体,实现它们的全面共享与协同工作。由于网格资源有分布性、异构性、动态
MANET网络是一种特殊的无线网络,它由一些移动主机构成,且不需要任何集中式的管理和标准支撑服务。网络中的节点不但具有普通移动终端的功能,而且具有路由的能力。由于无线链