元搜索引擎关键技术研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:liu395152417
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为Internet和Web技术发展过程中的一支劲旅,搜索引擎技术凭借其自身的特殊优势,在互联网前进的道路上扮演着越来越重要的作用和角色,同时也成为人们关注的热点。特别是近几年,因Web环境下信息的海量、异构及动态特性而引起“信息丰富,知识馈乏”的尴尬局面,使人们感觉到必须选择一种合适的索引技术来实现对Web信息的有效获取和访问。随着Web上信息的海量,异构及动态特性的不断升级,独立搜索引擎在解决Web搜索问题时越来越感到力不从心,这不仅为元搜索引擎研究与发展提供了必要性,也为元搜索引擎的发展提供了可能性。 所谓元搜索引擎是一种Web上应用的信息检索的软件系统,其通过将自身的查询请求转发给其它独立搜索引擎,再通过必要的中间处理过程,将各独立搜索引擎返回的结果集按一定的方案进行融合并显示给用户。 本文在对独立搜索引擎和元搜索引擎基本原理介绍与分析的基础上,深入地分析了元搜索引擎存在的必要性以及当前存在的不足,最后讨论了元搜索引擎研究中的两个重要问题:搜索引擎选择策略和结果集融合技术。具体研究内容及成果如下: (1) 独立搜索引擎和元搜索引擎基本原理介绍与分析,提出当前研究工作存在的不足。 (2) 介绍和分析当前主要搜索引擎选择策略问题解决方案的特点,提出基于神经网络模型的搜索引擎选择策略,并通过实验对本文提出的策略进行分析。 (3) 介绍和分析当前主要的结果集融合技术,提出基于摘要与标题相结合的去重算法和基于神经网络的结果集融合方法,并通过实验对本文提出的策略进行分析。
其他文献
运用语义万维网(Semantic Web)需要对传统的网络资源进行一些具有一定语义的标注。目前建立用于标注的本体(Ontology)是比较困难的。为了降低技术难度可以用一些具有结构化信息的
随着网络的发展及个人电脑的普及,越来越多的信息被发布到因特网上。Web信息门类齐全、数据量庞大,几乎无所不包,然而面对如此庞大的信息海洋,用户关心的只是其中很小的一部
为了确保网络时代的信息安全,国际上提出了基于公钥基础设施(PKI, Public Key Infrastructure)作为标准的信息安全体系结构,现己被普遍采用。在PKI中,最关键的实体是数字证书
随着Internet信息的迅速增长,Deep Web数据资源的数量急剧增加。然而,这些数据信息只能通过动态查询响应来获取,不容易被传统的搜索引擎如Google、百度搜索到,因此并未得到充
随着军用计算机网络蓬勃发展,渐渐深入到每个角落,网络管理问题随之而来。大型网络中心的网络管理问题受到空前的重视和改善,与之相对应的末端节点网络管理问题却一直没有很
近年来,人工智能广泛的应用于各个领域并得到了广泛的关注,智能割草机器人作为其代表产品,能够通过视觉传感器获取草地周围的环境,自动判断草地与障碍物,实现路径规划、自我
随着互联网络的发展,网络成了人们获取信息的重要工具。如何在互联网上有效地管理海量信息成了一项巨大的挑战,随之而来的内容管理技术和内容管理系统也成了热门的话题。内容
目前,问答系统作为一种新型的智能化的信息检索形式,作为一种更高效、更人性化的搜索引擎,已经成为信息检索和自然语言处理领域中重要研究方向之一。信息检索部分是整个问答
伴随着生活水平的改善,人们对身体健康的重视程度也逐渐提高。普适计算技术和信息化手段可以为人们“适时适地”地提供普遍适用的医疗服务与健康服务。为老年人以及患有多种
在互联网急速发展的今天,多媒体技术无不充斥着我们生活的方方面面,而作为信息丰富载体的图像,更是成了人们关注的主要对象。如何从复杂的图像中获取我们所需要的信息,成为人