基于多源特征的可能模糊共聚类方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：Dalyforever

【摘要】

：

【作者】

：

任嘉琪

【出处】

：

西安电子科技大学

【发表日期】

：

2020年02期

【关键词】

：

多任务聚类可能性聚类模糊共聚类鲁棒性聚类精度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着数据的增长和数据处理系统的不断改进,我们对开发强大而有效的数据处理和数据挖掘算法提出了更多要求,聚类算法作为数据挖掘的基本工具被广泛应用.在实际的聚类问题中,常常会因为特征集的提取不当以及异常值的干扰而对聚类结果产生较大影响.其中特征集提取面临着以下两大问题:首先,从样本中提取出的特征为聚类提供了较少的信息,即特征的虚弱性;其次,特征向量通常具有高维多源的性质,导致特征空间中的簇有着复杂的结构.异常值的干扰是令很多已提出的聚类算法头痛的问题,有限的异常值可能造成数据点划分的不精确或者完全错误.本文分别基于精确数据和不精确数据对聚类面临的这两大问题进行研究.首先,针对精确数据集,本文提出了多任务可能模糊共聚类算法(MPFC).该算法首先考虑到特征空间的结构差异,通过衡量不同特征源对各个簇类的贡献度对特征源进行合理分配.随后算法利用任务之间的信息共享,从不同方面挖掘数据特征所携带的信息,提高有效信息的利用率.最后,为了降低异常值对聚类结果的干扰,增加算法的鲁棒性,该算法利用了典型度的性质来识别异常值,并在聚类过程中弱化其影响力.同时,为了避免簇心受典型度的影响而导致重合,本文提出了新的参数选择指标,该指标利用了典型度的性质对参数进行校正,并通过校正后的参数牵制质心的移动.为了检验MPFC算法的性能,本文借助了多个数据集和相应的聚类算法进行实验.结果显示,MPFC算法不仅提高了聚类精度,而且大大降低了异常值对聚类结果的干扰.其次,在许多实际问题中,测量结果往往是不精确的实数或向量,这样的数据人们称为不精确数据.不精确数据存在极为广泛,常见的有气体含量的勘测等.当前的聚类算法大多用于处理精确数据集,为了提高聚类算法处理非精确数据的基准,本文将改进的MFC算法和新提出的MPFC算法拓广于非精确数据集上.由于非精确性通常是基于模糊集来处理的,故在对非精确数据进行处理时,本文使用LR型模糊集来进行聚类,并给出相应的距离度量方法.为了提高MFC算法的聚类精度,改进的MFC算法对隶属度随机初始化,且为了避免因初始化隶属度而导致簇心相近,该算法在构建新的参数选择指标时,在簇心之间添加了一个斥力,用于牵制簇心的移动.实验表明,MFC-F算法和MPFC-F算法与其他处理模糊数据的优秀算法相比,聚类效果更佳.最后,对研究内容和成果进行总结,为后续研究高性能的聚类算法奠定了基础.

其他文献

基于多视角点云模板的智能轮椅机械臂自主抓取技术的研究

针对残疾人和老年人日益增长的陪护需求,为减轻护理压力研发了一种集易用性,响应快速性和操作个性化于一身的载臂智能轮椅式助老助残机器人(Wheelchair Mounted Robotic Arm,

学位

助老助残自主抓取多视角模板物体识别位姿估计

社区居家养老服务中的政府职能研究

共享单车的出现,有效地满足了人们短距离内交通出行的需求,并在缓解城市交通拥堵等方面发挥了重要作用。但共享单车的出现也引发了一系列社会治理问题。本文基于协同治理理论

学位

协同治理共享单车共享经济杭州市

智能光网络的自组织临界性研究

近年来,随着ASON、OTN等智能光端设备的广泛推广使用,光网络的智能化程度越来越高,节点数量和节点容量越来越大,导致其物理拓扑结构和逻辑拓扑结构变得越来越复杂。具有动态

学位

智能光网络复杂网络自组织临界性沙堆模型

面向物联网数据特征的ICN缓存策略研究

随着互联网应用的快速发展,网络中的流量呈爆炸式增长,这给网络的计算、传输与存储带来了巨大的压力,为了从根本上解决这些问题,学者们提出了信息中心网络(Information-Centr

学位

信息中心网络物联网缓存策略

关于地区建设中社会关系资本构建的研究

在日本,尤其是90年代以后,随着全球化和人口老龄化的进一步推进,地区人口过疏过密等问题日益显现出来。不少地区面临着人口的减少、高龄化、防灾、环境等多方面问题,政策课题

学位

社会关系资本协动主义地区建设东京都新宿区

基于实物期权理论的券商信息技术投入价值研究

随着我国金融市场体系的完善和监管法规的日益健全,证券公司正以崭新的生命力活跃在金融舞台上,在我国资本市场的发展演变中扮演着日益重要的角色。当前互联网深入到社会经济

学位

证券公司技术投入实物期权价值评估

“5E”教学模式在粤北山区高一生物的教学实践研究

我国教育部最新发布的《高中生物课程标准(2017年版)》提出了新的课程理念,提倡高中生物让学生参加动手和动脑的活动,通过探究式学习让学生掌握生物大概念,通过学业评价促进

学位

“5E”教学模式高一生物粤北山区教学实践

涉及计算机程序的发明专利权利要求研究

涉及计算机程序的发明实质是一种程序流程,形式上表现为方法步骤,可通过撰写方法类权利要求申请发明专利予以保护。但是仅撰写方法类权利要求,无法规制制造、销售等侵权行为,

学位

计算机程序专利客体权利要求无形产品功能性特征

iNET系统多径衰落信道下的载波参数估计

随着遥测技术的不断发展以及对航空遥测系统研究的不断深入,人们认识到现有的遥测系统中还存在着很多的不足之处,近年来新一代遥测网络启动了增强遥测综合网(iNET)项目的开发计划,采用具有高频谱利用率的SOQPSK-TG传输体制以提高遥测系统的性能。然而在信息传输过程中,噪声、多径衰落和不可避免的干扰等严重影响了通信的可靠性,尤其在多径衰落信道下,部分响应SOQPSK-TG信号的同步对传输性能起着至关重

学位

iNET系统多径衰落载波同步编码辅助LDPC

乾嘉时期《离骚》要籍研究

《离骚》气往轹古、惊采绝艳,因《楚辞》一书纂辑过程、篇目内容的特殊性,历代学者对《楚辞》内涵与外延的界定多有不同,但在研读《楚辞》时,往往聚焦于屈原及其作品,并将《

学位

《离骚》楚辞《楚辞新注求确》《离骚笺》《屈原赋注》

基于多源特征的可能模糊共聚类方法研究

其他学术论文