P2P系统中的语义检索方案研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:FJHGL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从第一个P2P文件共享系统Napster产生以来,出现了许多P2P文件共享系统,P2P应用已经取代Web的地位成为ISP网络上最大的带宽消耗者。然而受资源类型多样化、搜索复杂度的制约,现有 P2P 文件共享系统中的搜索机制是基于文件名或者文件描述的关键字匹配的方式,这种方法虽然简单高效,但是它严重依赖于文件名或文件描述是否足够详细,并且不能深层次地挖掘关键字和资源内容间的相关关系,因此不能实现语义检索。此外,基于文件描述的关键字匹配方式需要由用户来编写文件描述,不能实现元数据的自动生成。 针对这个问题,本文提出一种新的搜索方案,该方案建立在已有的搜索机制之上,利用用户的搜索行为和下载行为的规律自动发现关键字和资源间的深层关系,在底层的P2P网络上构建一个元数据空间以辅助搜索。该方案具有实现代价小、时间复杂度低、可进化和支持语义搜索的优点。通过在Maze 系统上的实验表明它具有较高的查询命中率和查询准确率。 根据 Maze 系统的特点,作者对此方案作出了一些调整,利用Maze的消息机制,实现了Maze系统上资源推荐模块。该模块采用松耦合的方式和Maze系统进行交互,并具有相当好的可复用性。 本文的主要贡献如下: 1.提出了一种新颖的语义搜索方案,利用 P2P 共享系统中海量用户的搜索行为和下载行为自动计算关键字和资源内容的相关度,利用相关度来实现基于资源内容的搜索机制,具有实现代价小、时间复杂度低、可进化和支持语义搜索的优点。 2.通过模拟实验证明了本方案具有较高的查询命中率和准确率。虽然实验是利用Maze系统的搜索和下载日志进行的,而Maze并没有采用纯P2P结构,但是对于终端用户而言,底层系统采用的是何种机制是透明的,因而对于P2P共享系统这一类系统来说,用户的搜索和下载行为应当是类似的。因此,实验的结果具有一定的普适性。 3.根据Maze系统的特点,对本方案进行了调整,给出了Maze系统中资源推荐的设计和实现细节。
其他文献
本文对可扩展的应用服务器架构的设计与实现进行了研究。主要内容如下: (1)分析了容器、公共服务和底层通信的关系,提出了一种改善系统结构的解决方案,能便利系统的维护、更
随着信息社会数据量的日益增加,人们迫切需要有效的数据挖掘来发现其中的知识。数据挖掘的好坏不仅决定于挖掘的算法有效性,更决定于待挖掘数据的质量。数据预处理可以为数据挖
随着Intemet的普及和社会信息化的不断发展,越来越多的商业应用系统被开发和部署到各商业企业和公共服务部门中,在社会生活的各个领域扮演重要角色.机群计算环境(Cluster Com
随着嵌入式系统领域不断增长的应用需求,嵌入式系统的复杂性日益提高。作为一款优秀的、开源的操作系统,Linux在嵌入式领域的应用也越来越广。随着Linux内核的不断丰富以及应用
信息技术飞速发展,计算机审计取代过去传统的手工审计,成为现代审计领域的热点技术。我国从20世纪90年代末大力推广计算机审计以来,已取得很大的进步,多种审计软件问世,某些领域取
学位
互联网已经成为社会基础设施,网络规模持续扩大,新应用不断涌现,对网络管理和安全提出挑战。网络流量分类(Network Traffic Classification)作为流量管理和安全防范最重要的基础
在P2P文件共享系统中,如何能够将全部用户共享的文件检索到,并以合理的方式展现给用户,一直是困扰着P2P文件共享系统的设计者的难题。开放式的P2P环境下的高动态性等等特性,加大
心率是人体关键生理参数之一,与高血压、冠心病、脂质代谢异常等疾病密切相关,在疾病监测以及诊断中有举足轻重的地位。随着传感器技术的发展以及人们生活水平和健康意识的提高
微粒群算法源于对鸟群捕食行为的研究,它是以个体的协作与竞争来完成对复杂搜索空间内最优解的搜索,是一种基于群体智能的随机优化算法。微粒群算法的研究与应用近年来十分活
软件定义网络(Software Defined Networking,SDN)是一种新型的网络架构,它将网络的控制平面与数据平面分离,逻辑上集中式的控制平面使网络变的可编程、易管理。控制器在SDN网络中