【摘 要】
:
聚类分析是数据采掘和探查性数据分析中一个极为重要的技术,已被广泛地应用于工程、生物、心理、计算机视觉和遥感等领域.其目的是寻找隐藏在数据中简单有效的结构,而不只是
论文部分内容阅读
聚类分析是数据采掘和探查性数据分析中一个极为重要的技术,已被广泛地应用于工程、生物、心理、计算机视觉和遥感等领域.其目的是寻找隐藏在数据中简单有效的结构,而不只是为数据建立一个分类规则.由于聚类算法不对数据做任何统计假设,故在模式识别和人工智能等领域,聚类算法常被称为"无导师学习"或"自组织算法".该文主要是在研究密度聚类算法的基础上,结合分层聚类算法的优点,提出了一类新的聚类算法——基于密度的层次聚类算法.首先,对GDBSCAN和DBSCAN算法进行了深入的分析及研究,对其运行机制进行了详细的讨论,指出了该算法在参数选取时存在的缺陷.并针对其存在的缺陷提出了一种改进参数选取的方法,并对该改进方法进行了实例验证.其次结合基于密度的聚类方法和分层聚类方法两者的优点,提出了一类新的算法:基于密度的层次聚类算法.该算法具有如下优点:能发现任意形状的簇(类);能有效的过滤噪声点或孤立点;不依赖任何初始值;也没有任何领域知识输入要求;能找到最优的聚类;具有分层算法的聚类质量高等特点.最后,用实例验证了各算法的有效性,可行性.
其他文献
本文分为三章来讨论二阶脉冲泛函微分方程的积分边值问题,并推广了文献中的相关结论. 第一章介绍了二阶脉冲泛函微分方程的研究背景和国内外的研究成果,并给出了一些基础理
本文对临界指数增长的半线性椭圆方程多解存在性进行了研究。文章主要讨论了半线性椭圆方程:{-△u+a(x)u=u2*-1+f(x)x∈Ω,u>0x∈Ω,(*)u∈H10(Ω)多个正解的存在性,其中Ω是R
本文运用usco的方法,研究了约束条件下广义最大元的通有稳定性,集合族公共元的通有稳定性,并用集合族公共元的通有稳定性对若干问题的通有稳定性进行了统一描述.另外,在不具
在小学数学教学过程中,教师应对学生的自身能力与自主学习能力进行培养,并努力激发学生的个人兴趣,以保证学生的学习方法、学习能力得到积极提升.在本文中,根据教学中的实际
这篇论文研究了股东人数波动、股票买卖的限制、信息披露以及流通时间等对资产定价的影响.论文共分五部分.第一章简单评述了与论文的研究相关的经典的资产定价模型,然后介绍
本文主要是在锥上构造了三个非凸收缩核,同时用得到的非凸收缩核来计算不动点指数. 首先,我们对泛函形式的拉伸和压缩不动点定理的研究现状进行了简要的概述. 然后,在凹性
以联苯三唑醇为模板分子,通过电聚合邻苯二胺,在玻碳电极表面制备了对模板分子具有特异识别的分子印迹电化学传感器。实验选用铁氰化钾(K3[Fe(CN)6])作为电活性探针,采用循环
该论文包含了两个方面的内容.第一方面是关于多指标随机过程的样本轨道的分形性质的研究.具体来说,我们得到了对称稳定过程的水平集的确切Hausdorff测度函数.论文的第二部分
这篇博士论文集中了作者在攻读博士学位期间的主要研究成果.在第一章,我们构造了一个稳定调和映射序列,并说明它的弱极限是非稳定性.构造的动机是基于这样一个观察:如果将调