典型聚类算法及其应用研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:bvhd5467h
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是知识工程和模式识别中一个重要的研究领域,在对大量数据进行分析和处理时有其独特的地位。聚类领域方面的研究经过上世纪80到90年代的突飞猛进的发展之后,产生了种类和用途繁多的聚类算法,然而,由于聚类本身属于无指导性学习,其处理问题的方式,以及获得解的可靠性大多是经验性的,而且通常算法过度依赖于具体的应用背景。论文针对聚类算法研究现状,围绕聚类算法及其相关问题,总结和评价现有聚类算法,以及影响聚类分析的各个环节,探讨改进制约聚类性能的关键因素,并论文对普适性较好的聚类算法进行改进。 由于现在存在聚类算法众多,论文首先对各种聚类算法分门别类进行分析讨论,每类算法以其中较为典型的算法为例,在分析总结评价算法优缺点的同时,还剖析聚类算法的具有各种特性的原因;虽然,聚类在许多没有先验知识的应用环境下是不可或缺的,但在没有先验知识的环境下解决问题,从直觉上比有先验知识下解决问题更困难。对此,论文从理论上分析了聚类问题的规模和难度。并且分析得出,基于划分和基于密度的算法具有良好的特性,对这两类典型算法的研究和改进具有重要意义。 多维检索结构是制约众多聚类算法效率的关键环节,论文分析讨论了两类现有的多维索引结构,在此基础上提出了一种简单有效的多维索引结构,并将其用于一个视频关键帧的匹配问题上,同时讨论了它在提高聚类效率上可行的应用。 K平均聚类算法是一类重要的聚类算法,它是目前应用最广的基于划分的聚类算法,论文在研究和总结最近聚类算法的研究进展上,提出了一种改进的K平均聚类算法,并将它应用到文本聚类上,论文还分析对比了该方法的有效性。另外,MeanShift算法是一种基于密度的聚类算法,最近的研究表明它可以成功的应用到诸如图像分割的问题上,论文将K平均聚类算法和MeanShift聚类算法相结合,提出一种新的可变带宽策略对已有MeanShift算法进行有效改进,并将它应用到图像分割上;虽然,K平均聚类算法得到广泛应用,但其迭代过程的收敛性很少有研究者提及,论文将其归结为MeanShift迭代过程的一个特例从而分析了它的收敛性。
其他文献
软件产品的质量取决于开发并维护软件时所用过程的质量。和软件产品的质量—样,软件过程也需要持续改进。改进过程的唯—合理方法是度量过程的特定属性,收集度量数据,并对数据进
本文通过分析国内外智能家居技术的发展现状、水平及发展趋势,在进行了大量的资料查阅的基础上,针对智能家电设备编码方式混乱,通信管理没有统一的标准,管理过分依赖PC机来管理,而
“中油测井物流ERP系统”是一个由测井公司总部向国内、海外国家基地和作业区进行物资供应的管理信息系统。本文论述了ERP(企业资源计划)和物流的基本概念,介绍了分布式体系结
随着网络应用日益普及,网络安全正在成为人们不断关注的焦点。网络安全问题不仅涉及人们的隐私,而且已经威胁到国家的政治、经济、军事、文化、意识形态等诸多领域。 针对来
学位
随着信息技术的不断发展和应用,信息的安全性变得越来越重要。相关网络安全协议应运而生,而它们的基础都是安全有效的加密算法。椭圆曲线密码系统与其他公钥加密系统相比有很
J2EE以其规范的开放性、平台无关性、较好的可移植性、可扩展性以及多层分布式计算等诸多优点,正被越来越多地应用到航天卫星地面应用工程中来。本论文所研究的遥感卫星数据浏
随着计算机技术的高速发展,企业的应用系统和以往相比,有了很大的进步。企业级的应用不再局限于以往的单机系统或简单的客户端/服务器系统,而是逐渐向着三层、多层体系结构的分
Web数据库技术是Internet技术和数据库技术共同的发展方向,也是Internet应用研究的关键。WWW是Internet上最主要的信息服务方式,WWW系统和数据库是网络化信息服务的基础,数据库
分布式对象技术的出现弥补了传统分布计算技术的固有缺陷。经过几年的发展,分布式对象技术逐渐走向成熟。Sun公司提出的EJB模型作为最新的分布式对象计算模式,为开发服务器端的