论文部分内容阅读
随着对等网络技术的飞速发展,对等网络中共享的文本、图像、音频、视频等数据信息量正以惊人的速度增长,但当前对等网络信息检索仍采用文件名等关键字来描述文件内容,通过布尔运算匹配一组关键字来检索网络中的共享文件。这种方式已经越来越不适应对等网络信息检索的要求,需要在现有的对等网络搜索机制中引入基于内容的信息检索(CBR),即将原来基于集中式数据库的CBR系统扩展到完全分布式的对等网络中来。P2P网络搜索算法包括结构化方法和非结构化方法。前者基于分布式Hash表算法,只能对关键字进行简单的匹配,不支持模糊查询,不适合基于内容的信息检索,所以本文采用了非结构化方法,在类Gnutella网络中,结合Small-world原理,分别从用户兴趣、共享文件内容等角度出发,将对等网络中节点按照相似性分组,并优先在组内查找,从而提高查询效率,减小带宽消耗。首先研究了一种典型的基于用户兴趣的分组策略,分析其优缺点并提出了一种改进搜索机制,利用历史反馈信息对分组进行动态调整,能够及时反映系统中各节点共享内容的变化,使得系统能够在管理、通信开销和搜索效率间达到较优的平衡。仿真实验表明改进后的搜索机制性能有了较大提高。接着提出了一种基于“类簇”的P2P网络信息搜索机制。其基本思想是将具有同类共享文件的节点连接起来,形成一个“簇”,簇内的节点都包含同一类的文件,所以又称为“类簇”;节点加入网络时,根据各类信息发起查询,以找到所属的类簇,不同的类簇之间建立快捷连接;搜索时根据查询请求内容查找路由表,选择查询转发方向,通过快捷连接,快速定位到目标簇。由于簇内节点都包含与查询内容相似的文件,故可在簇内广播查询;在搜索过程中进行路由表更新,以获得最新的路由信息。仿真实验表明,该基于“类簇”的搜索机制具有较好的搜索性能。最后设计开发了一个在对等网络中采用“类簇”搜索机制进行图像检索的客户端原型系统,介绍了系统框架、功能模块和查询应答消息的设计。