多子类聚类算法的研究与应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:sunxunjun2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是在无标记的条件下将数据分组,从而发现数据的天然结构的一种技术。聚类在数据分析中扮演了重要的角色,它可以发现数据的潜在结构、对数据进行自然分组或压缩,是人工智能的重要分支之一。2019年,Nie Feiping等人在ACM SIGKDD上提出了指定k个聚类的多均值聚类算法(a multiple-means clustering method with specified K clusters,KMM)。KMM算法为每个类设置多个原型,将含多个子类中心的数据分配给特定的k类变成一个优化问题,交替更新数据对子类中心的划分和k个类的划分。KMM算法解决了K-均值算法在非凸模式簇上的劣势,并且比同类方法用时更少,聚类效果更好。但是KMM算法作为K-均值算法的一种拓展,存在对初始子类原型的选取敏感的问题,且其随机选取原型的方式导致该算法的聚类结果不稳定。此外,KMM算法虽然能很好的完成单视图聚类任务,但在多视图数据激增的今天,该算法却无法完成多视图聚类的任务。上述问题使得KMM算法在实际应用中存在很多不便。因此,对此算法进行改进和拓展,不仅能增强其实用性,也能拓宽其应用场景。本文针对该算法的前文所述缺陷进行的主要研究与工作包含以下几个方面:(1)针对KMM算法对初始原型敏感,且随机选取原型的方式使聚类结果不稳定的问题,提出了一种稳定的K-多均值聚类算法。新算法先基于数据样本的最邻近关系构造图,根据图的连通分支将数据分为若干组,取每组数据的均值点作为初始原型,再用交替迭代的方法对优化问题进行求解,得到最后的聚类结果。在人工数据集和真实数据集上的实验表明,新算法具有更稳定更优越的聚类效果。(2)将KMM算法扩展到多视图聚类问题上,提出一种多视图的K-多均值聚类算法。新算法引入了视图的权值,重新设计了目标函数,在求解目标函数的过程中找到最佳的视图权重分配。在若干多视图的数据集上,新算法比很多流行的多视图聚类算法效果更优。(3)将本文提出的FN-KMM算法应用于肺部X光片的分析问题中,将MKMM算法应用到区域水资源等级划分问题中。首先收集相关的数据资料,其次根据算法和聚类对象的特征对收集到的数据集进行预处理。将相应的算法应用到处理好的数据集上,得到聚类结果后,用三种聚类指标对聚类结果进行评价。通过对比分析不同算法在数据集上的聚类效果,证明了本文提出的两种算法都具有一定的实用价值。
其他文献
随着人机交互领域的不断扩张,人类赖以生存的物质世界与数字世界的边界愈发模糊,这导致了现实世界中真实物体的感受缺失。感受的过程是人与世界建立生命联系的过程,如何让人们重新关注现实世界中的直接感受成为当下之思。在众多数字化产物中,互动装置真实可感的实体界面,给予观众真切体验,但其相关研究多集中于技术应用和艺术观念层面,缺乏对实体界面及体验者自身的关注。体验者的亲历性决定了实体界面与“身体”相互蕴涵的交
传统的ELM优化算法关注的焦点都在隐含层输出权重上面,忽视了隐含层输入与输出的分布方式,针对这一容易令人忽视的方向,本文提出了基于高斯分布优化仿射参数的极限学习机模型,具体研究内容如下:针对让隐含层输出强制服从均匀分布效果不佳的问题,提出了在高斯分布下优化仿射变换的极限学习机(Extreme Learning Machine for Optimized Affine Transformation
论文针对目前乘坐扶梯经常出现的事故和危险行为,使用图像处理方法对扶梯上携带宠物、推车、抱小孩、攀爬等异常行为进行实时检测预警,在此基础上开发出智能监控系统,对扶梯场景进行实时检测分析和在线报警,保护乘客安全。论文主要进行了以下几个方面的研究:第一,针对扶梯入口、出口出现的快速运动导致的目标运动模糊问题,提出基于生成对抗网络的去运动模糊算法。使用生成对抗网络对模糊图片进行重构,以降低运动模糊的影响。
在当今社会的各个领域中,智能化是未来发展的大趋势;生活中的各类物联网产品、汽车飞机的无人驾驶技术、雷达系统、设备结构监测、基础建筑的安全检测以及工业生产自动化及其机器人系统都需要更加智能的感知技术;这就对传感器的感知精度和速度提出了更高的要求,且需要覆盖范围更广、覆盖密度更高的传感器网络。以工业生产中智能机器人为例,智能机器人需要代替人类在极端的环境下进行大量的危险性高、重复率高、难度大以及长时间
近年来,工业以太网技术促进了工业控制系统(Industrial Control System,ICS)和信息技术(Information Technology,IT)网络的集成,使得ICS信息化程度不断加深。信息网络集成虽然提高了系统生产效率,但也带来了更多新的信息安全问题。同时系统中设备节点数量众多且拓扑结构呈现分布式的趋势,传统中心化信息控制的方式中的性能瓶颈和安全问题将会日益明显。就关键基础
表面等离子体共振(SPR)传感器是一种免标记、高灵敏的光学传感器,它的原理是当入射光引起金属与介质界面的SPR时,可获得与共振波长一一对应的介质折射率。目前商用的SPR传感器均为棱镜耦合型,虽然灵敏度很高,但体积庞大,价格昂贵。随着纳米制备工艺的成熟和人们对传感器小型化的迫切需求,光栅耦合型SPR传感器应运而生。目前的光栅耦合型SPR传感器存在灵敏度较低,无法检测不透明溶液的问题,这限制了此类传感
随着车辆数量日益增多,道路交通问题密切影响着日常生活。交通监管部门需要通过视频数据实时监控路况信息。无人机技术的快速发展,使从空中视角获得数据成为可能。无人机能提供更加广阔灵活的视角,包含更多的信息,同时也能胜任长距离监控。在无人机场景下通过图像和视频对车辆目标进行跟踪,也有望成为交通监控的新方式。无人机视角下跟踪场景不够稳定,目标容易产生大幅度的形变,也可能被环境所遮挡。无人机的硬件平台也决定了
基于视觉的微小振动放大技术是一种通过处理图像时空信息,放大微小但重要变化的技术。机器视觉振动放大技术被用来揭示肉眼难以察觉微小变化,在工程结构模态识别、医疗心率检测,故障损伤检测等领域有重要价值。论文对视频微小振动放大技术进行详细的分析和研究,从多角度对微小振动放大算法进行优化,并将优化后的算法应用于非接触式心率检测,具有较好的工程应用价值。论文针对微小振动视频中存在大运动干扰,导致视频放大结果出
自NB-IoT(Narrow-Band Internet of Things,窄带物联网)技术提出以来,各项技术标准逐步得到完善,当前已经成为低功耗广域物联网中最具潜力的技术之一。在与各领域逐渐实现深度融合的过程中,NB-IoT设备将被大规模部署,考虑到NB-IoT系统的180KHz有限频谱资源,海量设备接入时将有可能发生资源竞争现象,使系统出现接入拥塞,从而导致网络接入量降低、资源浪费等问题。因
人脸表情识别是一项极具挑战的模式识别任务,在例如医学研究、交通安全、公共安防、刑侦审讯、影视娱乐等领域有重要的现实意义。对于可预见的未来世界中的高效人机交互,正确快速的识别用户表情也是一项必不可少的技术。近十年来,表情识别的研究进度突飞猛进,从小数据的室内研究转向了具有更大数据量的室外研究,研究方法也从传统方法变革为深度学习方法。深度表情识别的主要难点有以下几点:缺乏有效训练数据、存在大量表情无关