基于图的高维数据聚类方法研究

来源 :东北师范大学 | 被引量 : 1次 | 上传用户:catche
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是指按照数据对象本身的特性对其进行分组的过程。它在数据可视化、知识表示和数据挖掘领域中扮演着举足轻重的角色,一直以来,受到统计学家和机器学习研究者的广泛关注。从统计学的观点看,聚类是通过数据建模简化数据的一种方法,其目标是让组内的对象具有很大的相似性,而组间的对象具有很大的相异性。我们可以根据对数据类别信息的了解情况,将聚类方法分成两大类:一类为半监督聚类问题,另一类为无监督聚类问题。前者是在已知部分数据类别的前提下,研究如何对数据有效分组的问题;后者则是对数据的类别一无所知,单凭数据的特性进行分组的问题。本文将围绕这两类问题进行展开,从无向图和可加距离入手,解决高维数据和变量的聚类问题。从基本概念、处理过程、相似性度量以及算法收敛性等角度对这两类问题进行描述和讨论。并围绕文本数据和图像处理中的几类关键问题:如文本聚类、主题词提取、轮廓检测以及图像分割等领域展开研究,给出了一套完整的理论证明、求解思路和聚类算法,进而利用不同的评价指标和一些真实数据的对比实验,验证了本文提出方法的有效性和合理性。本文主要的创新点可以概括为:第一、本文给出了一个基于权重图聚类方法的统一框架,该框架通过引入已知顶点的邻域信息,使得本文提出的算法能够在较少种子点的情况下,精确地完成图像像素的聚类。第二、证明了当函数是非零多项同态映射时,定义在树图上的可加距离具有固定的形式。第三、提出了一种基于离散变量隐树模型的新算法,证明了该算法的概率渐近正确性,讨论了该算法恢复数据真实结构的正确率与样本量之间的关系。
其他文献
美军战时征用历经不同发展阶段,从一战时期对汽车、舟船等运力征用,到二战时期对民用飞机运力征用等等,其征用对象根据技术发展水平和战争需求也不断变化。美国国防能力建设在征用飞机和舰船方面已经具有成熟经验,并得到战争检验,在航天领域也开展了相关的论证和思考,并根据航天领域的特殊性,以商业服务采购的形式实现了民商卫星补充国防能力的目的。研究分析美军战时征用民商卫星的相关模式及实践,结合我国国情提出相关思考
在涉外民商事案件中,当事人约定适用条约的现象十分常见。我国法院虽然会尊重当事人的选择,但处理方式并不一致:有时法院会采用契约自由模式,将条约当作合同的内容;有时法院会采用意思自治模式,将条约当作准据法。虽然两种模式基于不同的法律制度,但都是对私法自治理念的坚持。从商事发展实践和立法动向来看,私法自治是符合国际商事发展的,因而法院应当尽可能尊重当事人对于条约适用的选择,并且应当优先将条约认定为准据法
本论文的主要内容分为三部分.第一部分,研究了几类孤立子可积系及其Hamilton结构.首先,在李代数B2和由它构造的李代数上,选取了两类满足屠格式条件的谱矩阵,构造了两类新的具有Hamilton结构的孤立子可积系.其次,考虑李代数so(4)上的两组基,得到了两类不同且均可约化为李代数so(3)上的孤立子可积系,找到了这两组基所对应的孤立子可积系之间的关系.此外,利用李代数so(4)与李代数su(2
本文主要研究Atiyah-Singer局部指标定理的推广和证明及非交换留数.Atiyah-Singer指标定理作为比较前沿的研究课题,将看似无关的数学两大分支—分析与拓扑—紧密结合起来,同时它也给微分几何,偏微分方程,微分拓扑,算子代数,数论等诸多领域提供了最基本的联系,具有重要的理论和应用价值.Atiyah和Singer在1961年联手解决了 Israel Gel’fand的猜测:用流形的拓扑不
本论文的主要内容分为三部分.第一,研究了5-Hom-Jordan李代数.首先,定义了分裂的正则5-Hom-Jordan李代数和它的根连通.其次,利用它的根连通,给出了最大长度的带有对称根系的单分裂的正则δ-Hom-Jordan李代数的充分必要条件和分裂的正则δ-Hom-Jordan李代数分解成若干单理想的直和的充分条件.第二,研究了Hom-Leibniz代数和Hom-李color代数.首先,定义分
现代应用科学中亟待解决的问题,经过数学建模,一般可以建立起“微分方程模型”,用微分方程或方程组来刻画.而对于这些方程或方程组的求解和分析,往往可以选取适当的状态空间并适当定义算子将微分方程化为抽象空间中的算子方程.这类非线性方程或带随机扰动的非线性方程解的存在性和性质的讨论可以用非线性分析或随机分析的方法来研究.在过去几十年中,这方面的研究方兴未艾.如果说线性数学可以寻求一般理论,进行统一处理;那
随着量子力学的诞生和快速发展,量子及其相关理论不仅在解释物理世界方面起到了重要作用,并且在现代社会进步中也扮演着重要的角色。一方面,随着近年来信息科学和材料科学的飞速发展,如何利用量子力学原理提高信息处理的效率和质量以及设计新型材料成为了现今科技发展的重要方向。另一方面,近年来对实现量子计算的物理系统方面的研究也取得了极大的进展。其中冷原子系统是众多方案中非常有前景的一个。本论文以Majorana
笔者根据蒯向磊等报道,运用中药熏法治疗尖锐湿疣,但将熏法改为湿敷治疗38例尖锐湿疣患者,收到较满意的疗效。报告如下:临床资料 38例患者均为女性,年龄最小者17
期刊