【摘 要】
:
聚类算法作为模式识别、数据挖掘领域的重要研究内容,受到研究者的广泛关注。近年来,许多对团簇状的数据表现出较好性能的聚类算法被提出,但面对结构复杂、边界不易区分、非球形分布和高维的数据集,单个聚类算法很难得到较好的聚类结果,集成聚类算法则可以解决上述问题。本文从多个方面研究集成聚类算法,并对集成聚类算法进行改进,具体研究内容如下:1.提出一种超簇加权的集成聚类算法。由于大多数集成聚类使用K-mean
论文部分内容阅读
聚类算法作为模式识别、数据挖掘领域的重要研究内容,受到研究者的广泛关注。近年来,许多对团簇状的数据表现出较好性能的聚类算法被提出,但面对结构复杂、边界不易区分、非球形分布和高维的数据集,单个聚类算法很难得到较好的聚类结果,集成聚类算法则可以解决上述问题。本文从多个方面研究集成聚类算法,并对集成聚类算法进行改进,具体研究内容如下:1.提出一种超簇加权的集成聚类算法。由于大多数集成聚类使用K-means算法生成基聚类,得到的基聚类效果不太理想。使用共协矩阵对基聚类进行集成时,平等地对待基聚类,忽视了基聚类的多样性。另外,当样本数目或集成规模较大时,以样本为操作单元生成共协矩阵,算法效率较低。基于地标点采样的超簇加权的集成聚类算法可以解决上述问题。该方法由三步构成:第一步是使用随机选点与K-means选点相结合的方法获取地标点,对地标点使用谱聚类算法得到其聚类结果,再将样本点映射到与之最近邻的地标点上生成基聚类;第二步对相交簇使用碎片整理策略得到超簇,以信息熵为依据计算基聚类的不确定性,并对基聚类赋予相应权重,最后使用加权的方式得到加权超簇的共协矩阵;第三步对共协矩阵使用层次聚类算法得到集成聚类结果。实验结果表明了该算法的有效性和运行效率。2.提出一种基于代表点和低秩表示的集成聚类算法。传统集成聚类算法在得到基聚类后,通常以全部样本为操作单元构建共协矩阵,且直接在共协矩阵上使用聚类算法得到集成聚类结果。样本点中的异常值等噪声对共协矩阵产生影响,降低了集成聚类的性能。基于低秩表示的通过代表点构建共协矩阵的集成聚类算法可以解决上述问题。该算法由三步构成:第一步得到基于基聚类的二元隶属度矩阵,将样本分为若干组,根据每组的二元隶属度值选取代表点;第二步根据代表点构建共协矩阵,通过低秩表示对共协矩阵进行优化;第三步对共协矩阵使用图聚类算法得到集成聚类结果。实验结果表明了该算法的有效性。3.提出一种基于集成聚类的文本聚类算法。传统文本聚类算法主要基于划分、层次、密度、网格或模型的聚类方法得到最终文本聚类结果,可以在文本聚类算法框架中使用集成聚类算法得到聚类结果,本文选取3个文本数据集进行算法实验,实验结果表明了该算法的良好性能。
其他文献
随着图形化信息技术的生活化渗透与大众常态化文娱需求的日渐提升,视觉文化迅速发展成为人们精神生活和文化生活的主要感知感受方式,公众的艺术审美能力和视觉美学鉴赏力普遍提升,视觉价值标准与审美需要也在不断被重塑。但是从当前传统剪纸文化的传承发展现状而言,其视觉构成上的转化完成度以及视觉文化信息的活态体验呈现远远不能满足用户的使用、审美以及情感诉求。传统文化视觉构建惯式大多仍停留在对传统文化内容元素的跟踪
图像融合的基本思想是利用特定算法将多种传感器对同一场景获取的图像提取不同信道的有用信息,最后融合成高质量的图像,以提高图像的利用率、可信度和准确性,在军事监测、医疗诊断和目标识别等领域广泛应用。在过去的几十年中,许多传统的图像融合方法被提出,这些图像融合算法大致可以分为两类,即空间域算法和变换域算法。空间域算法首先根据某种策略将源图像划分为若干个图像块,然后对每对图像块根据计算活动度量融合在一起。
随着电子信息技术的快速发展,印刷电路板(PCB)应用越来越广泛,为准确高效地对其进行检测,自动光学检测技术(AOI)逐渐发展起来且已被应用于实际生产。目前,AOI技术主要采用2D视觉检测方法,但是由于元器件表面字符印刷方式不同,元器件字符凹凸性不同、颜色和大小多样,2D字符识别系统的鲁棒性低,准确性不足。而PCB的3D点云(3D-PCB)数据中的高度信息能有效增强PCB的2D图像(2D-PCB)中
在食品3D打印过程中,大多数食品材料水分含量较高,流动性较强,且无光固化性、热熔性等固化特征,打印制品易发生形变、坍塌、流淌等现象。目前主流的解决方案是调整浆料组分,使浆料获得较好的流体力学性质,在流畅挤出的同时,保持结构强度。但此方案下打印的制品仍为流动态,无法规避打印及后加工处理过程中的形变因素。因此,本研究通过构建多物理场仿真模型,开发微波3D打印固化单元,以具有良好3D打印属性的鱼糜为打印
电子游戏已经成为大众生活中越来越重要的休闲娱乐活动之一,而功能游戏这一新的游戏品类由于具有较大的社会价值,正受到越来越多的关注。功能游戏强调其文化、教育等多重功能,不仅会影响到用户的体验感受,同时也关系到游戏功能作用的传达效果。认知负荷理论是现代认知心理学基础上发展而来的重要理论,具有广泛的应用能力与实操价值,早先已经有众多研究者将其运用于教育学领域用以验证学习成效,近年来也逐渐被运用到产品设计领
无线射频识别(Radio Frequency Identification,RFID)作为一种使用射频信号进行信息交互的技术,有效地实现物与物之间的非接触性识别的短距离通信技术,被广泛应用于智慧仓储、智慧驾驶、安防以及军事等多种前沿的领域中。在被广泛应用的同时,RFID系统存在的安全隐私、阅读器可移动性等问题也受到大家的关注。面对这些问题,国内外研究学者致力于提出一种有效的RFID安全认证协议来提
随着信息技术的快速发展,各行各业所创造的数据总量以惊人的速度快速增长。为了能从海量的数据中获得有效的信息,数据挖掘技术应运而生。目前,数据挖掘已被广泛应用于多个领域,在全球竞争、社会生活等方面均发挥了重要作用。但是在实际应用中,人们发现很多数据集的样本并不是均衡分布的。而且,传统分类算法是建立在数据分布均衡的基础上,处理不均衡数据会过多关注多数类样本,难以保证更有分类价值的少数类样本的分类性能。因
随着计算机视觉技术的发展,目标跟踪技术作为其中一项研究热点,在医学诊断系统,智能交通,机器视觉,行为识别等领域都有着广泛的应用。虽然,近些年国内外专家学者对目标跟踪技术贡献了各种各样的算法,但由于复杂多变的目标跟踪应用场景,依然面临着诸多挑战,例如:运动模糊,低分辨率,平面内(外)反转,物体遮挡等。这些挑战使得现有目标跟踪技术的跟踪效果与专家们的预期还有一定的距离。因此,如何提高跟踪技术的效率和稳
近年来,随着图像传感器技术及图像处理算法的日趋成熟,机器视觉检测技术在检测精度大幅提升的同时,其自动化检测生产线的成本大幅下降,这使得机器视觉检测技术在生产和生活的各个领域中得到广泛应用。但由于被检测物体种类丰富多样,表面特性变化多端,导致机器视觉缺陷检测技术在某些对光源要求严格的低适光性物体表面缺陷检测的应用中存在一定困难。为此,本文以高纹理物体表面和高反光曲面等低适光性表面为主要研究对象,设计
细粒度图像分类是指对大类下的子类进行更加精细的划分,比如区分一只鸟是海鸥还是大雁。随着人工智能的发展,同一基本类别下的物体的子类别分类的需求日益增多,如商品的品牌分类、植物研究领域的植物分类、车辆的型号和品牌分类等。然而,由于细粒度图像类别之间的差异很小,类别内部差异较大的原因,细粒度图像分类是一项非常困难的任务。由于子类别通常具有较小的类间差异,需要靠微小的局部差异对类别加以区分。论文在深度学习