【摘 要】
:
目前没有一个搜索引擎能够覆盖所有的WWW资源,而且大部分搜索引擎的索引平均只能涉及到整个WWW资源5%-20%左右。由于各个搜索引擎使用了不同的索引技术和信息收集技术,使得各
论文部分内容阅读
目前没有一个搜索引擎能够覆盖所有的WWW资源,而且大部分搜索引擎的索引平均只能涉及到整个WWW资源5%-20%左右。由于各个搜索引擎使用了不同的索引技术和信息收集技术,使得各自搜索的信息资源在很大程度上具有相当大的差异。实践表明,对于用户的同一查询,不同的搜索引擎会返回差异很大的查询结果。如果使用单一的搜索引擎,是不可能得到所有本可得到的资源。另外,搜索引擎在查询语法上,几乎每个搜索引擎都有所不同。这样用户为了使用这些搜索引擎,就不得不去熟悉每个搜索的搜索语法和功能。由于传统搜索引擎在这几方面的不足,而元搜索引擎又较好地解决了这些问题,所以本文把工作定位在元搜索引擎的研究上。本文阐述了基于代理的元搜索引擎的系统结构和关键技术。先介绍了搜索引擎的发展趋势和元搜索引擎的基本概念,接着介绍了代理技术和多代理系统以及多代理系统的特征、分类和交互等内容,最后提出基于代理的元搜索引擎的体系结构,并详细介绍了系统各个组成部分以及工作流程。本文设计并实现了一个基于多Agent协作系统的元搜索引擎原型系统。该系统主要由信息前处理层、查询代理层和信息后处理层组成。其中详细分析了每个搜索引擎的查询语法,尽可能地抽取大多数搜索引擎共同支持的语法格式,以XML形式定义了自己的语法规范。采用并行工作的搜索引擎代理完成与选定搜索引擎的交互,缩短了系统的响应时间。描述了现有系统的查询结果合成算法,并在此基础上,提出了一种多策略合成算法,从而提高了系统的查准率。
其他文献
书面汉语自动分词是中文信息处理中的重要步骤,它是文本校对、机器翻详、文本分类、文本检索、计算机人机接口等诸多中文信息应用领域的基础。目前汉语自动分词方法主要包括
两层传感器网络中的数据查询是用户获取和分析感知数据的重要手段。由于两层传感器网络具有资源受限、以数据为中心和应用相关等特征,且大都部署于无人值守、复杂多变的环境中
本文将多智能体系统和面向服务的架构的思想架构相融合,将其设计理念引入到微网EMS的管理与控制中,基于IEC61970国际标准,结合微网系统本身的特点,整合了整个微网的公共信息
随着互联网规模的不断扩大及其应用的多元化发展,对网络性能监控和运行管理的要求越来越高。其中对网络流量的测量与分析是网络管理中不可缺少的组成部分。网络管理员可以利
数据质量是保证数据能够有效地发挥作用的关键。数据质量的保证贯穿于数据的整个生命周期,它是一个系统过程,是一个质量评估分析和各种数据清洗方法相结合的不断反复的过程。本
近年来,随着IT技术的发展,越来越多的信息系统在各企业中建立起来,各企业内部通常都是通过这些系统来管理存储相关业务数据。通过几十年的发展积累,企业内需要管理存储的数据变得
Native XML数据库是随着XML的广泛应用而产生的,它专门用来存储和管理XML数据。Native XML数据库具有一般数据库的特性,但它的内部存储是基于XML数据的树形结构。它所存储的XML
随着当今社会的迅速信息化,各种多媒体信息资料飞速发展。音乐作为一门艺术,已经成为人类生活中必备的部分。一直以来,音乐都是人们表达情感的渠道,可以为欢乐而歌,可以为悲
随着WWW上资源的与日俱增,如何使用有效的方法从中获取所需的信息,成为研究人员所面临的一个重要问题。Web挖掘就是从Web上的数据(如Web日志、Web页面内容)发现用户的浏览模式
题库系统的建设和运用是促进教学技术改革和提高教学效率的一项重要工作。本文结合中学教育对题库系统的实际需求,从保障系统的安全性和提高成卷的质量这两个角度出发,运用基于