论文部分内容阅读
自从第一个P2P文件共享系统Napster产生以来,出现了许多P2P文件共享系统,P2P应用已经取代Web的地位成为ISP网络上最大的带宽消耗者。然而受资源类型多样化、搜索复杂度的制约,现有 P2P 文件共享系统中的搜索机制是基于文件名或者文件描述的关键字匹配的方式,这种方法虽然简单高效,但是它严重依赖于文件名或文件描述是否足够详细,并且不能深层次地挖掘关键字和资源内容间的相关关系,因此不能实现语义检索。此外,基于文件描述的关键字匹配方式需要由用户来编写文件描述,不能实现元数据的自动生成。
针对这个问题,本文提出一种新的搜索方案,该方案建立在已有的搜索机制之上,利用用户的搜索行为和下载行为的规律自动发现关键字和资源间的深层关系,在底层的P2P网络上构建一个元数据空间以辅助搜索。该方案具有实现代价小、时间复杂度低、可进化和支持语义搜索的优点。通过在Maze 系统上的实验表明它具有较高的查询命中率和查询准确率。
根据 Maze 系统的特点,作者对此方案作出了一些调整,利用Maze的消息机制,实现了Maze系统上资源推荐模块。该模块采用松耦合的方式和Maze系统进行交互,并具有相当好的可复用性。
本文的主要贡献如下:
1.提出了一种新颖的语义搜索方案,利用 P2P 共享系统中海量用户的搜索行为和下载行为自动计算关键字和资源内容的相关度,利用相关度来实现基于资源内容的搜索机制,具有实现代价小、时间复杂度低、可进化和支持语义搜索的优点。
2.通过模拟实验证明了本方案具有较高的查询命中率和准确率。虽然实验是利用Maze系统的搜索和下载日志进行的,而Maze并没有采用纯P2P结构,但是对于终端用户而言,底层系统采用的是何种机制是透明的,因而对于P2P共享系统这一类系统来说,用户的搜索和下载行为应当是类似的。因此,实验的结果具有一定的普适性。
3.根据Maze系统的特点,对本方案进行了调整,给出了Maze系统中资源推荐的设计和实现细节。