【摘 要】
:
聚类算法如今已成为数据挖掘中不可缺少的一部分,随着信息技术的迅速发展,对于聚类算法的研究和改进更加深入。聚类算法,顾名思义根据数据对象的自身特征(或属性)及规定的衡量标准对样本集进行划分,它是一种无监督的学习方法,无需提前知晓各样本点的归属情况。传统的聚类算法需提前设定聚类簇数、初始聚类中心和阈值等相关参数,且这些参数的设定或选取凭经验而定(即没有明确的标准),同时不同的取值很大程度上影响着聚类的
论文部分内容阅读
聚类算法如今已成为数据挖掘中不可缺少的一部分,随着信息技术的迅速发展,对于聚类算法的研究和改进更加深入。聚类算法,顾名思义根据数据对象的自身特征(或属性)及规定的衡量标准对样本集进行划分,它是一种无监督的学习方法,无需提前知晓各样本点的归属情况。传统的聚类算法需提前设定聚类簇数、初始聚类中心和阈值等相关参数,且这些参数的设定或选取凭经验而定(即没有明确的标准),同时不同的取值很大程度上影响着聚类的结果,这就使得在实际操作中很难进行,也会造成聚类结果的不稳定。因此,提高聚类算法的自适应性,使其仅依靠样本对象自身特征进行聚类显得尤为重要。本文分别针对演化聚类算法和模糊聚类算法的缺点提出了两种自适应的改进方法,其在很大程度上提高了原始聚类算法的稳定性和准确性。(1)演化聚类算法是一种演化的在线聚类算法,该算法可实时地增加聚类个数、调整聚类中心和聚类半径,从而获得最佳聚类结果。但传统的演化聚类算法需提前设定阈值,在没有获取数据集先验条件的情况下,阈值的选取很难决定,而不同的阈值会很大程度上影响最终的聚类效果;同时传统的演化聚类算法对样本点的输入次序较敏感。针对传统演化聚类算法的缺点,本文提出了一种改进的自适应演化聚类算法,该算法先对若干数据样本点进行预聚类,从而得到初始聚类结果;再根据新加入的样本点不断调整聚类中心和聚类半径;最后再根据分类情况选择分割或融合,再次对聚类结果进行调整,以获得最佳聚类效果。该算法显著地改善了聚类结果对于阈值选取和样本点输入次序的依赖,更适用于处理实际数据分类问题。实验结果表明,改进的自适应聚类算法能够实现动态在线聚类,显著提高了聚类结果的正确率和稳定性。(2)模糊C-均值聚类算法是一种被广泛应用的聚类算法,其根据各样本点对聚类簇的隶属度进行分类,打破了传统聚类算法对于簇的归属非1即0的情况。但是传统模糊聚类算法需提前设置参数和初始聚类中心,选取不同的参数和初始聚类中心会很大程度上影响最终的聚类结果。针对传统模糊聚类算法的缺点,本文提出一种基于权重差异度的动态模糊聚类算法。首先,引入样本特征权重向量和样本间差异度的概念,对数据集分布情况进行描述,并采用新的评价指标获取候选聚类中心;然后,根据最小差异度准则,对剩余样本点进行分类;最后结合戴维森保丁指数评价准则对候选聚类中心做进一步筛选与合并。该算法根据具体数据集中各样本点的空间分布情况动态确定聚类个数和初始聚类中心,同时考虑类间离散程度和类内离散程度,有效地减少了随机选取聚类中心对聚类结果稳定性的影响。实验结果表明,该算法在测试不同数据集上的性能明显优于传统聚类算法,具有更高的自适应性和稳定性。
其他文献
近年来,指数级增长的网络终端和有限的频谱资源之间的矛盾冲突日益严重,对无线网络部署提出了更高的挑战。在大规模高密度网络中,由于节点随机密集分布且移动性强、信道环境
随着我国经济由“高速增长”向“高质量发展”转变,如何在新环境下提升企业的技术创新绩效愈发成为亟待解决的问题。企业家精神对技术创新绩效的提升有一定作用,然而,在新经济时代企业家精神有新的内涵和表现形式,需要进一步探明企业家精神和技术创新绩效的关系。技术创新绩效的提升不仅受到企业行为的影响,而且会受到行业竞争环境的影响,故而这种影响也需要进一步研究。基于资源基础理论和战略匹配理论,本文探讨企业家精神与
随着卫星导航系统的不断进步与发展,其对精度的要求越来越高。用户接收机通道非理想的特性会影响到普通用户的定位精度,而导航系统中的监测接收机通道非理想的特性则会影响到
多输入多输出(Multi-input-multi-output,MIMO)雷达作为一种新体制雷达,具有多个发射天线和多个接收天线。相对于传统的只能发射单一波形的相控阵雷达,MIMO雷达可以同时发射
卷积神经网络(CNN)在图像等原始输入数据的特征提取方面取得了很大的成功。尽管传统卷积神经网络对输入上的平移是具有不变性的,但它们对其他变换(包括旋转和翻转)并不是不变的。通常,全局旋转不变性通常是通过数据增强来寻求的,但对于每一块都具有旋转不变性是十分困难的。本文针对传统卷积神经网络不具有旋转不变性的难点提出了一种基于图像矩的卷积神经网络拓扑结构,它结合图像矩以及卷积网络两种技术。本文证明它能够
论文择取中外政党现行章程的文本比较为选题,以中外政党现行章程为研究对象,从文本角度进行解读,以期通过对中外政党党章文本的研究,得出关于党章文本的更全面、更深刻的规律性认识,以充实与完善中国共产党党章理论。全文结构如下:第一部分是导论。主要是选题的背景及意义,相关的概念界定,研究综述,研究方法,研究目的以及可能存在的创新点、难点与不足之处。第二部分是中外政党党章文本评述。对中国共产党党章和从目前所能
目前世界经济处于深度调整,全球经济迈向复苏之路步履维艰。“一带一路”的倡导的确有效促进了全球经济复苏,经济全球化,推动了各地经济迅猛发展。沿线国家吸收中国的直接投
现代国防装备及工业设备中,穿过金属结构进行无线通信正逐渐成为重要的工业需求。传统的无线通信技术是以电磁波为媒介进行传播的,但是密闭的金属结构造成的法拉第效应使得电
目前,智能视频监控系统已经广泛应用于交通、金融、生产制造等行业。随着人口老龄化日益严重,老人视频监控系统也得到了深入研究。常用的老人视频监控系统主要包括视频采集、网络传输、算法模块和人机交互四个部分。其中,算法模块可以处理包括摔倒、突发疾病等异常行为的识别,使得系统实现了实时监控和突发情况报警等功能。算法模块包括视频图像预处理、目标检测、目标跟踪和识别等子模块,是视频监控系统保持高准确性和高实时性
针对自动制造系统(Automated Manufacturing Systems,AMSs)的死锁问题,人们提出了许多基于Petri网的控制策略。这些策略往往假定AMSs中资源是可靠的。然而,在现实系统中可能会发生不可预测的资源故障。在这种情况下,现存的死锁控制策略变得不再有效。为了解决这一问题,本文以一般Petri网(generalized system of simple sequential