P2P系统中聚类算法的研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:jyc894784116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着 P2P技术的不断发展,P2P系统已经成为储存海量数据的容器,如何在这样一个包含丰富数据的容器中发现知识成为越来越多的学者研究的内容。P2P技术最大的特点是没有中心节点,系统完全分布,这虽然使得P2P系统具有健壮性和可扩展性,但也加大了设计适用于P2P系统的数据挖掘算法的难度。  聚类是一种常用的数据挖掘技术。本文在分析了不同 P2P拓扑结构特点的基础上,通过深入研究了不同聚类算法的聚类过程,总结了 P2P系统中的聚类算法需要满足的条件,并在此基础上设计了 KIPN(K-mean In P2p Networks)聚类算法和SOC(Structure Overlay Clustering)聚类算法分别用于非结构化拓和结构化拓扑P2P系统的聚类。  KIPN算法是一个非结构化拓扑P2P系统的k-mean算法,通过扩展经典k-mean算法的迭代过程,在每个节点只与其直接相邻节点交换信息的情况下通过有限次迭代使每个节点上的局部数据在全局视图下聚类。经实验数据分析验证KIPN算法可以适应P2P系统中的节点动态变化,并与集中式聚类算法有相似的聚类结果。  SOC算法利用结构化CAN系统中数据严格按照规律分布的特点,将系统坐标空间与聚类数据空间重叠,使相邻数据存储在同一(或相邻)节点上。用系统坐标空间划分的逆过程进行凝聚型层次聚类,使CAN系统数据聚类达到与集中式聚类算法相同的结果。通过分析 SOC算法的聚类过程得到在数据维数一定的情况下算法的时间复杂度与系统中的节点数呈线性关系。  本文的另一个工作是设计并实现了一个 P2P聚类算法的仿真实验系统,并在该系统中对两个算法进行仿真实验。系统设计时使用了设计模式中的思想,使两个算法能够方便在同一框架下实现。
其他文献
网格计算系统就是将地理分布、系统异构、性能各异的各种资源,包括超级计算机、大规模存储系统、个人计算机、各种设备等组织在一个统一的框架下通过高速互连网络连接集成起
现在,国内交通基础设施正值高速建设期,网络基础设施也有了广泛的普及,优质、高效的工程目标要求有规范化、自动化和实时化的项目管理。如何将工程建设所遵循的合同制度、质量标
本文首先对群件系统及其基本结构进行了简介,之后阐述了工作流技术的原理和工作流模型,并对工作流技术在办公自动化系统中的应用进行了讨论。介绍了群件系统LotusDomino/Notes
本文结合当今流行的分布对象技术,提出一个能够比较全面地刻画基于集群的并行系统特征的并行计算模型DOBPCM(Distributed Object Based Parallel Computing Model)。该模型使
VPN涉及的技术包括:安全隧道技术,用户认证技术,访问控制技术,加解密技术等.其中最核心的技术是安全隧道技术,目前普遍使用的是利用IPSec协议实现的安全隧道技术.本文首先介
本文针对房屋中介业务的需求,并根据GIS领域的发展现状和趋势,将GIS技术引入房屋中介业务,设计与实现了基于GIS的房屋中介系统,以取代当前房屋中介行业现有的MIS系统,使房屋中介公
计算机作为科学与技术高速发展的一个重要标志,已经普及和渗透到人们工作和生活的各个方面。人们越来越不能忍受计算机系统故障所造成的损失。软件是计算机系统的核心,由于软件
本文在对商业企业和生产企业进销存业务进行深入分析的基础上,针对某商业企业的具体情况,提出了作者自己的构想和解决方案,并在此基础上给出了相应模块的实现和应用实施。本项目
Ad Hoc网络终端的电池能量有限、网络拓扑结构动态变化、通信使用无线信道及分布式控制技术等,这些因素使得确保正常的网络通信变得比较困难。而网络可生存性研究旨在保证系
随着信息技术的进步及全球互联网应用的迅猛发展,企业的传统经营模式已经不能适应时代的要求,全新的电子商务运营模式的出现,使企业能够通过互联网络以一种快捷、方便、高效的方