【摘 要】
:
聚类分析是在对数据不给任何假设的条件下,用数学方法研究和处理所给对象的分类以及各类之间的相似程度。随着现代信息技术的发展,已广泛应用于各种工程和科学领域,如模式识
论文部分内容阅读
聚类分析是在对数据不给任何假设的条件下,用数学方法研究和处理所给对象的分类以及各类之间的相似程度。随着现代信息技术的发展,已广泛应用于各种工程和科学领域,如模式识别、数据挖掘、图像分析、信息检索、生物信息学、心理学、通讯、远程感应等。
聚类算法和最佳聚类数的选择在整个聚类分析过程中是最关键的步骤。目前出现的聚类算法有很多,这些算法可以被分为基于划分方法、基于层次方法、基于密度方法、基于网格方法和基于模型方法等。一般来讲,聚类的最终目标是使类内距离极小化而类间距离极大化,因此,将优化的聚类个数应用于基于高斯核的模糊聚类算法。
本文对聚类分析的基本思想和典型算法进行了归纳和研究,通过定义类内紧密性及类间离散性准则,引入高斯核,对模糊动态聚类算法进一步研究,主要研究以下三方面的内容:
(1)通过类内离差和与类间距离和的比较,对聚类个数进行优化。
(2)采用应用凝聚层次聚类算法来构造初始聚类中心,并将优化的聚类个数应用于基于高斯核的模糊聚类算法。
(3)用IRIS数据集和Wine数据集对算法进行了比较实验,结果表明优化的聚类个数与原始数据一致,准确率优于凝聚层次聚类算法、模糊C均值算法、KFCM算法。
本文引入定义类内紧密性及类间离散性准则,可以在优化的聚类数的基础之上进行聚类,使得本文的算法得到更好的聚类结果,并且所获得的结果具有重要的应用价值。
其他文献
体育是一门增强学生体质、锻炼学生意志、培养学生健康心理品质的学科,但体育训练又是相对枯燥的活动,体育教师如何把握学科特点,结合学生在训练过程中存在的问题,创新体育教
在经典的回归模型中,观测值的方差齐性是一个基本的假定.在此假定下,方可进行常规的统计推断.菪方差非齐而且未知,则回归分析将遇到诸多问题.人们发现在社会经济现象中,存在
本文研究了三类生态数学模型行波解的存在性.全文分为四章.
第一章是引言,介绍反应扩散方程行波解的研究背景及本文的主要工作和结果.
第二章研究了一类具有无穷分
“金杯银杯不如群众口碑,金奖银奖不如百姓夸奖。”这是湖南省衡阳县委书记张玉林经常说的一句话。从政20多年来,他始终牢记党的全心全意为人民服务的宗旨,自觉坚持权为民所
图谱理论是代数图论中一个重要课题.利用图的特征值来研究图的结构性质是图谱理论的核心内容,经过几十年的发展已形成系统、成熟的理论.已有许多专著出版[5,8,9].
图的
本论文研究的内容主要分为两部分:第一部分定义了一类新的代数-Ur-代数,并对其性质进行了研究;第二部分计算了Ur-代数的低阶Hochschild上同调,包括零阶和一阶.
Kac-Moody代数
自从Zadeh在1965年提出了模糊集概念并创立了模糊集理论后,国内外的很多学者对模糊代数作了大量的研究工作,极大地丰富了模糊代数的成果,本文在此基础上研究并讨论了广义模糊
跟踪雷达的应用日益广泛,不仅用于各种火炮控制,导弹制导,外弹道测量,卫星跟踪,突防技术研究等军事部门.一般情况下,雷达自动跟踪一个目标,而同时扫描多架航机时,针对某一目标,则会出现
流形学习方法(Manifold Learning)自2000年在著名的科学杂志《Science》上被首次提出以来,已成为信息科学领域的研究热点。在理论和应用上,流形学习方法都具有重要的研究意义。
业务流程设置的合理性和实用性是企业管理的重点,工程师在设置业务流程时,由于侧重的角度不同,所设置的流程也会不尽相同。并不是所有的流程都能契合地满足流程管理的要求。