论文部分内容阅读
近年来随着许多P2P系统的出现,P2P技术逐渐成为人们研究的热点。P2P技术目前主要应用在文件共享、分布式计算、协作系统、电子商务和以P2P为基础的深度搜索引擎等方面。其中,信息共享是最常见的一种应用。在P2P共享系统中,每个节点既可以将本地资源共享出来与其它节点分享,又可以从其它节点获取资源,实现了服务器与客户端的两位一体。然而,现有的信息检索机制存在着种种不足:基于结构化P2P网络的检索效率很高,但是由于构造过于严格,难以在Internet上普及,而且仅能支持粗粒度的文件共享;非结构化P2P网络实现简单,是P2P文件共享系统的主要实现方式,但是由于搜索的盲目性,其检索效率又普遍比较低。本文在深入研究P2P信息检索技术的基础上,重点研究了基于非结构化P2P网络的信息检索技术。针对现有P2P检索的路由盲目性问题,论文给出了能够适应网络可扩展性的路由查询机制。该机制在检索过程中根据各节点的响应顺序,将每一条查询路径上的回复节点信息分别保存在与它相邻的两个回复节点的路由信息表中,并据此为以后的检索提供路由。在没有路由信息可用的情况下,将选择原始邻居节点进行路由,以利用原始拓扑结构的特点。最后用实验结果证明了本文算法的有效性。由于用户一般对前几个检索结果比较感兴趣,并且各响应节点将检索结果直接返回给请求节点,增加了请求节点的负载。针对这两点,本文利用路由信息表检索机制,采用top-k查询对检索结果进行处理。在返回检索结果时根据查询条件只返回匹配度最高的top k个文档,如果符合查询条件的不足k个,则只返回符合条件的查询结果,这样降低了网络开销,减轻了请求节点的负担。最后通过性能分析和仿真实验证明了它的实用性和准确性。