流形学习与基于流形假设的半监督学习研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：wenzheng

【摘要】

：

流形学习和半监督学习是当前机器学习领域的研究热点，已经受到越来越多研究者的关注。作为一种非线性的维数约减方法，流形学习能够有效地学习出高度非线性、属性强相关的高维流

【作者】

：

韦佳

【机构】

：

华南理工大学

【出处】

：

华南理工大学

【发表日期】

：

2009年期

【关键词】

：

流形学习流形学习流形假设流形假设半监督学习半监督学习维数约减维数约减模式分类模式分类机器学习机器学习线性代数法线性代数法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

流形学习和半监督学习是当前机器学习领域的研究热点，已经受到越来越多研究者的关注。作为一种非线性的维数约减方法，流形学习能够有效地学习出高度非线性、属性强相关的高维流形数据的内在几何结构。流形假设是半监督学习中常用的一种基本假设，它是指处于一个很小的局部邻域内的样本具有相似的性质，这与流形学习中局部线性的思想是一致的。如果高维数据采样于一个低维流形且监督信息在流形上具有某种性质，那么借助流形学习思想，就可以用大量的无标记样本学习出数据的内在几何结构，然后利用这种结构和监督信息能够得到更好的半监督学习结果。　　本文在分析了流形学习和半监督学习的发展现状和目前仍存在的问题的基础上，主要对流形学习和基于流形假设的半监督学习在降维和分类中的应用进行了研究，具体研究内容包括：　　 1、孤立点不敏感的流形学习研究：提出一种基于改进距离的孤立点检测方法用于降低孤立点对流形学习算法的影响。实验结果表明，相比于基于欧式距离的孤立点检测方法，该方法在样本分布不均情况下的鲁棒性更强。　　 2、流形学习邻域选取问题的研究：提出一种自适应邻域选取算法，在不指定全局邻域参数的情况下，根据数据集的结构自行选择每个点的邻域，使得流形学习算法在没有全局最优邻域参数的数据集上也能得到满意的结果。　　 3、有监督流形学习研究：提出一种有监督的最大方差伸展算法（S-MVU），该算法能够对多类流形数据进行处理，使得所得结果既能保持类间数据的区别，又能够恢复类内数据的流形结构。实验结果表明，相比于其他的有监督流形学习方法，该方法的适应性和可视化效果更好。　　 4、基于流形假设的半监督维数约减研究：提出一种基于局部与全局保持的半监督维数约减方法（LGSSDR），该算法能够很好地利用成对约束信息，并考虑到了给定数据集的流形结构，保持数据集的局部以及全局结构。另外提出一种基于局部重构误差与全局保持的半监督维数约减方法（LRGPSSDR），该算法通过最小化局部重建误差的方法来精确确定邻域图的边权值，对邻域参数的设置也不敏感。　　 5、基于流形假设的半监督判别分析研究：提出一种基于局部重构误差与全局保持的半监督判别分析方法（LRGPSSDA），该算法通过最小化局部重建误差的方法来精确确定邻域图的边权值，在保持样本局部结构的同时能够保持其全局结构，对邻域参数的设置不敏感，所得投影子空间的维数不受样本类别数的限制。　　 6、基于流形假设的半监督分类研究：提出一种基于鲁棒路径的半监督分类方法（SSCRPR），该方法利用鲁棒路径相似度获取标记样本及未标记样本的流形结构，然后构造鲁棒路径正则化项，分别通过线性代数方法和流形正则化框架得到线性及非线性分类函数。

其他文献

基于使用剖面的航天软件可靠性测试数据生成方法的研究

计算机已经广泛地应用于航空、航天、武器装备、工业控制、交通、金融和医疗等领域,这些系统越来越多地使用软件进行控制,软件是否正确运行已经关系到人的生命安危,软件失效

学位

可靠性测试使用剖面操作序列

原位根系CT序列图像的三维可视化重建系统

根系是植物从土壤中获取养分和水分的重要器官，根系的生长分布状况直接影响植物吸收水分和养分的能力。长期以来缺乏直接从土壤中获取根系原位形态参数的无损检测分析方法成了

学位

原位根系无损检测CT序列图像三维可视化

工作流实例方面可视化建模工具的研究

工作流是20世纪90年代发展起来的一种反映业务流程计算机化的模型,是为了在先进计算机环境支持下实现经营过程集成与经营过程自动化而建立的可由流程管理系统执行的业务模型

学位

工作流建模工具成批处理实例方面模型MVC模式

一个静态程序缺陷查找工具的设计与部分实现

软件缺陷是导致软件质量下降，软件成本升高，开发周期加长等的重要因素。为了帮助程序员更快的查找软件缺陷，研发人员们经过不懈努力，提出了一些行之有效的方法，静态分析就是众多方

学位

半自动化扩展代码分析软件质量静态程序软件缺陷查找

基于Mobile SVG的移动GIS在军事领域的应用研究

军事地理信息系统是数字化战场建设的重点，在动态战场信息管理，作战地域的战场态势变化，作战辅助诀策所产生的空间数据库更新，战术标图、距离、道路等战术计算方面有非常重要的战

学位

军事地理信息系统军事地理信息系统移动GIS移动GIS矢量地图矢量地图移动对象移动对象

领域本体在自动问答系统中的应用研究

与传统的搜索引擎相比,自动问答系统在理论上能够更好地满足用户的检索需求。但是,真实世界中的提问对于自动问答系统来说通常很复杂,主要是由于问答系统缺乏丰富的世界知识

学位

自动问答系统领域本体规则推理汉语框架网

基于SQL Server2005的数据库性能优化研究与实践

数据库是数据库应用程序的基础与核心。随着数据库规模的迅速增长以及并发访问用户的增加,数据库的性能对数据库应用程序的访问速度起着决定性的作用。因此,对数据库进行优化

学位

Web Services搜索工具的设计与实现

软件复用是解决软件危机的一条切实可行的途径。成功的实施软件复用，需要大量的软件构件资源。近年来，Web Services作为一种部署在Internet上的新型的服务构件受到广泛的重视和

学位

软件复用构件收集描述信息向量空间模型搜索工具

遥感图像理解中语义知识应用研究

现代空天飞行技术和传感器技术的高速发展，为人类提供了极为丰富的遥感图像数据。为了高效地从遥感图像中提取有效信息，利用计算机系统解译遥感图像，即进行遥感图像理解，已成为遥

学位

遥感图像

基于联合双重网络和双向解码的汉泰神经网络机器翻译

随着互联网技术的快速发展和广泛应用，人们都处于一个信息高度共享的、更加连通的世界。如今，在学术、工业和商业领域的成果和产出已不仅适用于单一国家，也同样适用于全球的各个

学位

机器翻译系统神经网络编码器解码器

流形学习与基于流形假设的半监督学习研究

其他学术论文