半监督聚类集成模型研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:hdy_123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类技术作为机器学习领域中的重要技术之一,已经被广泛地用于解决不同领域的实际问题,聚类可根据对象间的相似性把分布未知的数据集划分为不同的簇,并遵循类内(intra-class)对象相似度最大而类间(inter-class)对象相似度最小的原则。然而,大多数用于解决聚类问题的算法是无监督的方法,无法有效地利用已知的先验知识;另外,由于数据结构的复杂性以及聚类算法优化准则的多样性,单一的聚类算法仍然难以计算出样本集的实际分布结构。为提高聚类算法的稳定性,相关学者提出了聚类集成技术,而传统的聚类集成方法不能利用先验知识来指导聚类集成过程,为更好地提高聚类集成的性能,半监督聚类集成技术应运而生。近年来,半监督聚类技术因其充分地利用了先验知识来提高聚类的性能在聚类领域获得了广泛的关注,尤其是对象间的Must-Link和Cannot-Link成对约束已经广泛地应用于半监督聚类学习中。虽然成对约束包含的的潜在信息可以提高聚类的准确率,但是约束集合的数量和质量往往决定了算法性能能够提升的程度。本文通过组合自动和主动的约束选取方法提出了一种有效地提高约束质量和扩展约束集合的方法,该方法基于某个簇中大部分数据对象是核心对象以及少部分对象是边界对象这一特征来构造约束选取方法,因此,在核心对象之间考虑使用自动的约束选取方法,而在边界对象间使用主动的约束选取方法。实验结果表明,本文提出的混合约束选取方法在选取高质量的约束信息方面有较好的竞争优势,选取的约束可以明显地提高聚类方法的准确率。聚类集成技术可以有效地提高聚类算法的性能,通过融合有差异性的聚类结果,从而得到更加准确和稳定的划分结果。传统的聚类集成方法没有有效地利用先验知识来指导集成过程,本文基于有限混合模型的集成方法提出了一种半监督聚类集成模型,在混合模型集成的EM迭代过程中根据类标签来优化计算方法,将类标签信息用于指导EM方法从而提高算法的性能。实验结果表明,与不加入先验知识的混合模型集成方法以及其它无监督聚类集成方法相比,该方法能有效地提高聚类的质量。
其他文献
学位
信道编码盲识别技术是指仅根据所截获的有限的编码数据对编码方式及编码参数进行快速有效的解析。该技术在军事领域和信息对抗领域,具有十分重要的实际应用价值。本课题主要
随着国内外计算机视觉和数字图像处理技术的发展,已有大量学者对目标检测算法进行研究和论证分析,然而计算机视觉领域的研究还有许多问题等待解决。视频序列图像的运动目标检
浮雕曲面的建模设计和数控加工技术逐渐应用于人们的日常生活和工业生产中,本文结合企业的实际需求和立体浮雕产品的设计方案,重点对图像浮雕曲面建模和几何浮雕曲面建模技术
随着互联网的蓬勃发展以及网络应用软件的广泛使用,网络信息安全变得越来越重要。在当前动态开放的网络环境中,各主体往往隶属于不同的安全域,如何在陌生实体之间建立有效的信任
随着电子商务网站的迅速发展,快速、准确的查找出用户需要的商品成为研究的热点。目前,电子商务中多采用基于文本的商品检索方式,无法满足用户对商品图像检索的需求。因此,人们希
本文首先阐述了网络编码的研究现状,对典型的网络编码进行了综述、分类和分析。基于批次的随机线性网络编码BB_RLNC应用于无线网络时可以提高网络吞吐量,但是依然存在难以协
随着互联网技术的发展,互联网中数据传输的规模迅速增长。现有的大规模数据跨域传输大多是基于边界网关协议(BorderGatewayProtocol,BGP)的,BGP作为域间单路径路由协议存在数
近几十年来,随着计算机仿真、计算机游戏和虚拟现实等领域的不断发展,柔性物体的碰撞检测越来越成为计算机图形学中的热点问题。精确高效的碰撞检测算法对于增强柔性体仿真的
当前,互联网正迅猛发展,信息安全受到的威胁日益增多,隐私保护变得愈加重要。隐私保护的手段繁多,其中匿名通信是目前互联网上保护用户隐私的一种重要手段,它能够有效防御攻