基于流形学习的分类技术

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:Shauphei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对数据进行分类时,有效的特征提取方法是取得良好分类效果的重要前提。然而,由于现代信息的海量性、非结构性以及非线性等特征,使得特征提取成为模式识别、机器学习等领域的新挑战。虽然传统的特征提取方式在数据降维方面已取得较大进展,但面对非线性和线性流形领域仍存在许多问题亟待解决。在此背景下,流形学习作为一种有效降维方式,受到研究者广泛关注。本文围绕经典流形学习方式,对半监督数据、数据的局部相关性定义、数据子模式以及噪声数据等进行研究,具体研究成果如下:(1)结合原始高维空间与低维特征空间中未标记样例的分类信息,提出一种新的表情识别方法。首先,使用标准的标记传播算法得到数据的初始类标矩阵,然后运用NPE算法得到数据在低维特征空间的流形结构,最后,更新数据在特征空间的类标矩阵。由于更新标记矩阵的过程考虑了数据的流形特征,因此新的标记矩阵比源空间的初始标记矩阵更准确地描述了数据的特征结构。实验结果证明了该方法的有效性。(2)为了更准确的描述类内数据的局部相关性关系,提出一种新的类内离散度矩阵,进而提出一种局部相关判定近邻保持嵌入算法。该方法定义的局部相关保持类内离散度矩阵不仅包含数据的局部保持特征,同时有效保持数据近邻相关性信息,更准确提取数据特征。基于此,对MMNPE算法进行改进,更准确地提取数据的类判别特征,为下一步的分类过程提供良好的基础。数据集Yale和ORL上证明了该方法的有效性。(3)提出一种改进的子模式局部保持投影算法,主要思想是将不同类别的数据划分子集,对每个子集划分子模块,对子模块分别运用LPP算法。该方法考虑了个体间流形的差异性,认为不同个体具有其独特的流形,提出将所有人脸图像划分子集,将相同类别的图像组成一个子集合,因此子集合内部的图像具有较高的相似性和更加紧凑的流形结构。实验表明该算法能提高识别率,减少运行时间。(4)当数据存在混叠问题时会造成SVM过学习和泛化性能的减弱,针对此问题提出一种基于信息熵数据修剪的支持向量机:EB-SVM。用信息熵的概念对训练集进行修剪,很大程度上删除了噪声和冗余数据,降低了分类边界附近数据的混淆程度。实验表明,与传统的SVM和KCNN-SVM相比,EB-SVM的泛化性能更高。
其他文献
多标记学习广泛存在于现实世界中,是当前机器学习和数据挖掘领域的研究热点。多标记学习的提出,更好的丰富和发展了现有的分类问题,解决了现实存在的二分类学习算法无法确定和解
随着人工神经网络的发展,人工神经网络在神经科学的研究中占据重要地位。近期神经科学最新研究成果表明,大脑中神经信息不仅仅是通过脉冲发放频率进行编码,还可以通过脉冲精确定
分形理论是几何学的一个新的研究方向——分形几何学,因为其能够很好的模拟自然景物,又名大自然的几何学。除了具有普通艺术图案的特点之外,分形图形一般具有自相似性和无限的精
法医学家在做体表损伤司法鉴定时,往往需要综合考虑体表损伤面积大小、损伤区域皮肤颜色变化程度、相关鉴定标准等多种因素才能判定体表损伤级别。在研发新版本的“体表损伤
我国现行的城市排水系统中大部分还是以人工经验为主导的管理方式,信息化、自动化应用比较少。在日常调度中因人工主观经验及孤立调度,导致泵站排水耗电量大的等问题,难以满足当
随着数据挖掘研究的不断深入,群体智能越来越受到研究人员关注,作为其重要分支的蚁群聚类算法备受学者们青睐。蚁群聚类算法是受蚂蚁群体行为启发而设计的智能仿生算法,具有群体
航天嵌入式软件是面向航天领域的特殊的嵌入式软件,它的可靠性和健壮性直接关系到航天飞行器的安全。如果没有对软件进行充分的调试和验证,一旦出现问题,不仅造成飞行器的损毁,甚
随着形式概念分析在数据挖掘、知识发现等领域的深入研究,其理论的扩展也开始受到越来越广泛的关注。三元概念分析作为形式概念分析的一种三元扩展,是一种新的分析三维数据的理
洪涝灾害是世界上影响最大的自然灾害之一,城市洪涝灾害已经成为了世界性的难题。一个避免城市洪涝灾害问题的方法是通过提高排水系统输送水资源的效率减少因泵站溢流造成的人
网格计算最高目标是能够同电网一样使用网格中的资源,网格中的资源包括计算机,集群,计算机池、仪器、设备、传感器、存储设备、数据、软件等实体以及实体工作时所需要的软件和数