基于高斯过程的降维方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：guider_zq

【摘要】

：

在当今这个信息大爆炸的时代,随着科学技术特别是计算机技术的飞速发展,大规模的高维数据大量涌现,且这些数据往往具有非线性结构,如何从这些数据中分析提取有价值的信息变得

【作者】

：

姜鑫维

【出处】

：

华中科技大学

【发表日期】

：

2012年期

【关键词】

：

高斯过程降维隐变量模型薄板样条梯度学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在当今这个信息大爆炸的时代,随着科学技术特别是计算机技术的飞速发展,大规模的高维数据大量涌现,且这些数据往往具有非线性结构,如何从这些数据中分析提取有价值的信息变得越来越重要,其中很多的数据分析方法正是基于降维模型,例如人脸识别问题,其本质就是降维问题,另外由于维数灾难,高维数据降维也成为数据挖掘等任务中必不可少的步骤。根据是否利用有监督的标注信息来帮助降维,可将所有的降维技术分为有监督降维和无监督降维。主成分分析(PCA)就是一种经典的无监督降维模型,在大量的现实数据分析任务中得到了广泛应用,然而无监督降维方法往往不能利用有监督的标注信息,这对于很多提供了标签信息(对应回归任务的实数值标签和对应分类任务的离散标签)的数据集,或者对于一些未被标注但标签信息能够很方便地基于一些重要的本征属性得到的数据集(例如人脸和数字字符数据库中能够很容易地标注样本)来说,是对有价值的标注信息的浪费,大量的研究已经表明,这种标注信息能够帮助提高降维模型的性能,线性判别分析(LDA)模型就是一个最好例证。因此在降维模型中考虑附加的标注信息的思想直接驱动了研究者对有监督降维模型的研究,目前已经出现了很多的有监督降维模型,并在一些应用取得了不俗的性能,但依然存在着一些问题,例如不能充分利用标注信息、算法复杂度较高等。本文主要讨论贝叶斯统计框架下基于高斯过程的降维模型,提出了一种新的无监督降维模型和两种新的有监督降维方法,并通过模拟和现实数据集检验了这三种新的降维模型。本文的主要内容可概括为：1).概述了目前常见的降维模型。目前已经存在大量的降维模型,本文尝试通过将这些降维模型分为无监督和有监督模型来分别介绍,并且进一步地,还按照是否显式地建模低维空间和高维观测空间之间的关系将每一类模型再次细分为基于谱方法和基于隐变量模型的降维方法,此外还在每一个小类中详细介绍了一到三个具有代表性的模型,并据此概括更多的同类模型及其优缺点。2).提出了一种新的无监督降维模型及其两类扩展。这种新的基于隐变量的降维模型显式地利用薄板样条函数建模隐变量和观测变量之间的非线性关系,从而获得了薄板样条模型所特有的属性,即特别适合于那些隐空间维度较低,且/或存在潜在旋转和平移的数据集。此外,该模型还可被简单地看做是一种使用特殊核函数的高斯过程隐变量模型。两种模型扩展,即动态扩展和后向限制进一步为模型施加限制,在特定任务中显示出了更佳的性能。3).提出了一种新的有监督降维模型。通过对现有基于隐变量模型的有监督降维方法的分析,提出了一种的新的高斯过程隐变量模型的有监督扩展,该模型不仅可使用隐变量模型来解释,而且还与传统的有监督降维框架中的半参数模型完美地联系起来,该模型不仅在降维能力上到了提升,而且与现有有监督模型相比,其算法复杂度也得到了降低。此外,更进一步提出了一种基于新提出的有监督降维模型的扩展,这种扩展模型在训练样本较大时能够进一步提高降维模型的性能。4).提出了一种新的梯度学习模型。该模型可以看做是一种间接的基于谱方法的有监督降维模型。已有的梯度学习模型的目标是通过直接学习样本集的梯度来间接地对数据进行有监督降维,并推断变量之间的相互关联信息。新提出的梯度学习模型通过将已有的直接梯度学习模型利用高斯过程泛化到贝叶斯统计框架中,提供了原始梯度学习模型所不具有的误差估计,并且也提高了模型的精度。

其他文献

中国银行业在支持“一带一路”建设中得到更快发展

'一带一路'建设离不开银行的支持,银行开拓新的国际业务,也离不开'一带一路'项目,银行业如何在支持'一带一路'中得到更大发展,本文提出了多项建议第

期刊

银行业“一带一路”建设金融板块

可见光通信中白光LED空间光强分布的研究

白光LED因其低功耗、寿命长、尺寸小、绿色环保等优点,慢慢取代了日光灯和白炽灯。与此同时,白光LED具有调制特性好、响应灵敏等优势,可将通信信号调制在LED上进行传输,实现

学位

可见光通信发光二极管信道建模发射天线光强分布

区域创新能力对我国主要省份机电产品RCA影响的实证分析

利用2001年～2006年中国10省市面板数据,采用面板模型研究区域创新能力与各省市机电产品RCA的关系,得出区域创新能力对各省机电产品RCA有显著促进作用,但因地而异的结论,各地应

期刊

区域创新能力RCA面板数据模型

左归饮质量标准研究

目的：建立左归饮质量标准。方法：采用薄层色谱法对左归饮中的枸杞子进行定性鉴别;采用高效液相色谱法测定左归饮中毛蕊花糖苷、马钱苷以及甘草苷的含量。结果：枸杞子薄层色谱斑

期刊

左归饮枸杞子毛蕊花糖苷马钱苷甘草苷质量控制高效液相色谱法薄层色谱法

成本与技术:数据中心外包的驱动力

伴随企业信息化建设的发展，数据中心需求正处于快速上升的阶段。从IT发展趋势看，越来越多的企业，其整体运营依靠于IT平台，也就是说，7×24小时的连续性IT服务已经成为业务连续

期刊

驱动力数据中心PUE电力消耗电力成本

图像稀疏表示模型在可视化追踪中的应用研究

可视化目标追踪是计算机视觉领域中一个重要的研究方向,并且在许多实际的应用中(如视频监控,视频场景的理解,交互视频处理等)起着至关重要的作用。目前,研究人员已经提出了大

学位

目标追踪稀疏表示多示例学习多尺度块稀疏编码直方图粒子滤波器外观模型判别式模型产生式模型

《化学电源》课堂教学与实践教学相结合教学模式的探索

本文阐述了高校开设《化学电源》课程的必要性,探讨了将课堂教学与日常生活相结合、与"三个实践"教学环节相结合、与大学生创新实验相结合、与课程设计相结合以及抓住时机创

期刊

化学电源课堂教学实践教学

黄芪注射液对SD大鼠心肌缺血再灌注损伤中Smad3、Smad7表达的影响

目的：探讨黄芪注射液对 SD大鼠心肌缺血再灌注损伤（MIRI）中Smad3、Smad7表达的影响和机制。方法采用结扎左冠状动脉的方法制备心肌缺血再灌注损伤动物模型。32只健康成年 SD大鼠

期刊

黄芪注射液心肌缺血心肌再灌注损伤SMAD3蛋白SMAD7蛋白astragalus injection myocardial ischemiamyoca

复杂适应系统量化仿真与分析关键技术研究

随着人类步入21世纪,复杂系统与复杂性科学问题变得日益突出,其中包括环境、资源、经济、人口、健康、灾害、甚至和平与安全等困扰人类生存和社会可持续发展的重大问题,这些

学位

复杂适应系统量化分析多Agent系统建模与仿真涌现信任机制Stigmergy分布式MAS作战建模

新时期如何做好家园共育工作

在新时期内,人们对幼儿教育的质量要求越来越高,幼儿期是孩子成长发育的特殊阶段,对家人的依赖性很高,针对这种特点,开展家园共育是幼儿园工作的一项重要工作内容,为了给幼儿

期刊

幼儿园家园共育共育渠道

基于高斯过程的降维方法研究

其他学术论文