论文部分内容阅读
随着互联网的飞速发展,人们享受着丰富的网络资源,但能够满足用户个性化需求的网络服务非常匮乏。于是,产生了庞大的数字化网络信息与有限的获取所需信息能力的尖锐矛盾,并且随着网络及其资源的急速膨胀而日益突出。搜索引擎在一定程度上解决了这个矛盾,但仍存在一些亟待解决的问题,诸如如何实现基于内容的视频、音频等多媒体信息的搜索,如何提高海量数据上的检索更新效率,如何有效存储海量数据。解决上述问题已成为下一代搜索引擎技术的研究方向。目前流行的对等网络具有分布式、可量测性、负载平衡的优点,为解决这些问题提供了可能性。本文在深入研究P2P技术和搜索引擎技术的基础上,大胆地结合局部遍历型搜索技术与P2P Chord协议,提出了一个基于P2P的分布式搜索引擎系统方案(P2P-based Distributed Search Engine,PPDSE)。该系统方案可有效地减少相似度查询的计算复杂性,提高查询效率;并且在海量数据存储与查询操作并发方面占有优势。该系统方案具有技术上的先进性和操作上的可行性。PPDSE系统方案包含两个模块,PPDSE Agent和PPDSE Pocket。PPDSE Agent为用户提供注册服务,是PPDSE系统的智能代理服务中心;PPDSE Pocket是PPDSE系统的核心部分,设计为三层框架结构,用户应用层、控制层、数据层。其中,用户应用层提供用户查询、上传数据资料等功能;控制层使用局部遍历型搜索技术对信息进行聚类,建立信息树,将多维空间上的相似度度量问题转化成一维度量空间上的间隔问题;数据层提供了快速的资源定位机制、高效的结点路由机制和并行处理机制,提出了将局部遍历搜索应用于Chord协议上的SE-Chord算法。