【摘 要】
:
随着Web信息的快速增长,搜索引擎已成为用户信息检索的主要工具。元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是它们返回的结果往往数目庞大,并且很多结
论文部分内容阅读
随着Web信息的快速增长,搜索引擎已成为用户信息检索的主要工具。元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是它们返回的结果往往数目庞大,并且很多结果与用户查询并不相关,这直接影响了用户检索的质量和大大提高了用户检索的代价。为了帮助用户在避免无用信息干扰的情况下获得其所需的信息,本文对元搜索引擎的个性化搜索进行了研究和实验。 本文首先对元搜索引擎和个性化搜索进行了概述,然后从各个方面对现有的相关研究进行了分析和比较,并以用户兴趣模型为基础,提出了实现用户个性化搜索的相关算法。本文主要研究的工作包括: (1) 提出了用户查询到用户兴趣类的映射算法。它通过结合用户兴趣模型来推测用户的查询意图,分析出用户搜索的兴趣类。这些兴趣类为成员引擎个性化调度和结果合成处理提供了依据。 (2) 提出了基于兴趣分类采样的成员引擎特征表示的方法和基于用户兴趣的成员引擎个性化调度算法。调度算法根据用户的兴趣计算出各成员引擎与用户查询的相关度,为用户选择最具有潜在有用的多个成员引擎来为用户提供查询服务,提高了用户的检索效率和质量。 (3) 提出了基于用户兴趣的结果合成算法。它根据用户兴趣对结果进行相似度计算和结果去重,从而为用户提供贴切的查询结果。 本文最后设计和实现了一个基于客户端的个性化元搜索引擎的原型系统PMSE,并对文中提出的算法进行了实验和分析。
其他文献
近年来,随着Internet技术的迅猛发展,计算机网络给人们的工作、学习和日常生活带来了很大的便利,同时Web开发技术也在不断更新。J2EE是SUN公司提出的开发企业级应用的平台,包装了
自从2005年物联网概念在国际电信联盟互联网报告中被正式提出之后,现已越来越多的被运用在人们日常生活中,包括交通、电力、农业、水利、安全、环境和家居等各个方面,然而对
随着我国信息自动化技术的普及,人工超表的方式显得日益落伍,用信息自动化技术进行抄表方式的改造,势在必行。但是我国10KV以下的电力网络,由于其主要分布在城市市区内,不仅地理分布复杂而且数量众多。以往采用的诸如:电力载波通讯、电话网络通讯、RS485、光缆通讯、局部无线通讯等,或多或少存在着一些弊病,如:电话通讯系统速度缓慢;光缆通讯方式造价高、施工困难等。因此在10 KV以下电力网络中,实时数据监
随着信息技术的飞速发展,在计算机支持的协同学习(Computer-SupportedCollaborative Learning,简称CSCL)的研究领域中,协同感知已成为该领域内的一个十分活跃的研究方向。它的目
在大多数的中小企业的生产计划与排产过程中,目前对生产线上的排产工作很大程度上依赖于有经验的老师傅与相关专家人工调整进行,很容易因为疏忽或者是先天的限制产生错误的判断
现今,在嵌入式控制领域里,面对各种设备控制功能需求的不断增长,以往所采用的8位嵌入式处理器已经不能满足需求。随着EDA技术的发展,设计一种面向某一类设备的专用处理器已经成为
SIP协议因其简单、灵活的技术特点,正在逐步代替原有的H.323协议成为IP语音技术(VoIP)的信令核心协议,基于SIP的VoIP终端研究也随之成为一个热点。然而,目前大多数终端的研究
本论文以高校教学管理系统为研究对象,在严格依照软件开发流程开发高校教学管理系统的基础上,对软件开发方法、软件体系结构、关键技术作了较为深入的研究。主要内容为: 第一
访问控制是信息安全保障机制的核心内容,是实现数据保密性和完整性机制的主要手段。 本文首先介绍了访问控制的现状,随之总结自主访问控制和强制访问控制两种传统访问控制
显微镜下的脑脊液(Cerebrospinal Fluid,CSF)图像由各种细胞组成,其拓扑结构复杂多变,采用传统图像分割算法需要对目标进行高精度完整的分割,才能准确的提取到人为事先定义的