多视角生成模型的可解释性聚类研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:chensiren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的聚类算法仅从单一视角对数据进行分析,并且由于聚类分析缺乏带有语义的类标签,因此得到的聚类划分不具有可解释性。聚类划分的可解释性即聚类划分由决策规则推理得到,并且聚类划分可以被定性和定量地描述。多视角的和可解释的聚类划分将给决策者提供更多地选择空间,并且可以使决策者批判性、改善性和探索性地相信和使用聚类划分。本文针对聚类的多视角性和可解释性问题,提出多视角生成模型的可解释性聚类(Interpretable Clustering with Multi-view Generative model,ICMG)。ICMG能够生成多个视角,并且基于视角得到多个有效的和无冗余的聚类划分,最后通过视角的语义信息对聚类划分进行定性和定量地解释。本文完成的工作如下:(1)构建嵌入多视角因素的贝叶斯案例模型(Muti-view Bayesian Case Model,MBCM)。MBCM是将多视角因素引入到贝叶斯案例模型上的一个生成模型,MBCM可以生成含有多视角因素的数据。(2)构建多视角生成模型(Multi-view Generative Model,MGM)。MGM基于有效原则和无冗余原则使用贝叶斯程序学习(BPL)的组合思想和MBCM生成多个有效的无冗余视角,并使用原型和子空间描述视角。(3)提出多视角生成模型的可解释性聚类(ICMG)。ICMG首先使用MGM得到多个使用原型和子空间描述的视角;然后利用原型和子空间构建规则集,基于规则集进行聚类;最后使用原型和子空间所附带的语义信息定性和定量地解释聚类划分,进而得到有语义的类标签。本文使用多组数据集进行实验,实验结果表明ICMG能够得到多种可解释的聚类划分并且相比于传统聚类算法具有较明显的优势,同时通过聚类划分可解释性的验证实验表明ICMG得到的聚类划分比传统多视角聚类的聚类划分更易理解。
其他文献
无线Ad Hoc网络(Wireless Ad Hoc Networks)是没有中心实体和基础设施支持的自组织网络,它由多个带有无线收发装置的移动节点组成。移动终端具有路由转发功能,可以通过无线链
红外热成像技术是利用自然景物的热辐射得到成像数据,形成视觉图像,可以在夜间甚至全黑的环境中工作,而且由于红外辐射具有穿透烟雾的能力,使得红外热成像技术具有很长好的穿
VPN是从专用网络发展而来的,它利用公共网络建立私密传输通道,提供安全地端到端的数据通信。其中PPTP是第二层隧道协议,并且已经集成到Windows操作系统中,具有安全性高、成本
随着生物基因相关技术的发展,基因组测序的完成预示着人类步入了后基因组时代,生物基因的研究方向也从基因序列研究转向了结构和功能的研究。深入挖掘其中的信息,为生命科学
随着互联网、通信以及广播电视等技术在国内的快速发展,智能网络电视作为三网融合的产物,已经显示出了蓬勃的发展前景,成为业界关注的热点。智能网络电视的实现需要服务端软
随着信息技术的迅猛发展以及计算机性能的逐步提高,人们对于计算机的要求也越来越高,处理器也朝着专用化和通用化两个方向发展。在科学计算等领域,随着研究内容的扩展和算法复杂
当今中国,随着互联网的普及和网络终端的高速发展,网络已经深入到了人们生活的方方面面。面对海量的网络信息,搜索引擎的出现极大的方便了普通用户的操作,但大量的重复或近似网页
随着互联网技术的不断发展,Web服务得到越来越多的应用,基于Web服务的各类软件也被广泛的应用在企业及各类政府机构中。而Web服务其松散耦合、语言及平台无关的特性使得Web服
随着视频内容信息的不断充实以及视频应用的不断深入,基于视频序列的应用研究已经成为当今多媒体的主流方向。因此,对视频图像序列中运动前景的提取跟踪、分类和行为识别已经
近年来,各专业领域用户对于行业集群通信的需求日益增多,集群通信方便、快捷和信道资源共享等特点使其迅速发展。数字集群通信具备兼容性、开放性、保密性强、频谱利用率高等