基于潜在表示和非相关稀疏回归的特征选择

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:menghuilong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于科技的发展,高维数据迅速出现在各行各业。噪声、冗余特征也随之而来,这加大了数据处理的工作量和难度。因此,数据降维是必须的。由于可以保留原始的特征,特征选择成为了降维的更佳选择。近年来,无监督特征选择算法越来越多,并且都取得了不错的效果。但是这些算法仍存在一些问题,比如伪标签间的相互影响被忽略、数据间的链接信息没有被充分利用以及使用谱聚类时不能保证伪标签的非负性等。为了解决这些问题,本文提出了三种新的特征选择算法。本文的主要研究内容为:(1)提出了一种基于非凸约束和拉普拉斯嵌入的潜在表示学习的特征选择算法。首先,该算法通过构造潜在特征图,来保留伪标签间的相互信息。其次,潜在表示学习是在由潜在特征空间和数据空间组成的空间中进行的。因此潜在表示考虑了伪标签之间的互连信息,潜在表示空间中包含的信息更加完整。此外,为了充分利用伪标签,将学习到的潜在表示矩阵作为伪标签信息,在潜在表示空间中提供聚类标签,指导特征选择。最后,将非负约束和l2,1-2-norm非凸约束应用于特征变换矩阵,以保证特征变换矩阵的行稀疏性,选择低冗余特征,提高特征选择效果。(2)提出了一种基于稀疏潜在表示和扩展OLSDA的非相关特征选择算法。首先,该算法通过潜在表示学习保留数据本身之间的互连性,保留数据之间的内在信息。为了去除冗余的互连信息,对潜在表示学习的残差矩阵施加l2,1-norm约束。其次,该算法通过嵌入非负流形结构的最小二乘判别分析,获取非负伪标签,并且消除拉普拉斯矩阵对特征选择的影响。此外,将潜在表示和最小二乘判别分析联合作用的矩阵作为伪标签信息,来保证伪标签更接近真实类标。最后,为了选择不相关的特征,对特征变换矩阵施加不相关约束和l2,1-norm约束。(3)提出了一种基于中心点链接信息和稀疏潜在表示的鲁棒特征选择算法。首先,通过中心矩阵构造链接图,保留样本到中心点的距离信息,从而保留样本之间的相似性。其次,该算法利用数据图和链接图构成一个双图结构,保留样本间的链接信息和流形结构。然后,通过稀疏潜在表示保留样本之间的互连信息,保留稀疏不冗余的互连信息。并且通过中心点链接信息和稀疏潜在表示结合,保留的数据之间的隐藏信息更加全面。最后,为了选择鲁棒且稀疏的特征,该算法通过约束条件l2,1/2-norm对特征变换矩阵进行约束。
其他文献
随着深度神经网络的发展,基于全监督的语义分割方法在近年来不断取得突破进展,然而全监督的语义分割方法过度依赖于密集像素标注,这类标注信息需要高昂的时间与人工成本。为了降低语义分割任务对于标注信息的强依赖性,基于弱监督的语义分割方法逐渐受到了人们的关注。该类方法通常采用较为容易获取的标签,例如边界框标签,涂鸦标签,和图像级标签等。在这其中,图像级标签因为制作成本较低而被广泛使用。基于图像级标签的弱监督
学位
遥感影像变化检测旨在从多时相遥感影像中确定与获取感兴趣的地物要素变化,这在城市规划、环境监测、经济发展、国防建设等领域有重要的应用。深度学习为遥感影像变化检提供了新思路,它能够从多时相影像中自动学习特征,高效准确地提取变化信息。然而,基于深度学习的变化检测方法存如下问题:变化信息较少,相对大场景中的非变化信息是稀疏的,标注数据类别间存在不平衡;需要手工标注大规模数据集进行训练,标注成本极高。本文围
学位
近年来,由于网络的迅速发展,复杂网络变得越来越难以有效的检测,不仅是因为网络的规模的骤增,还因为网络中的节点包含着丰富的内容。另外,网络的节点也不在仅仅处于一个社区内,还有可能与多个社区有所联系。因此,对于重叠社区和属性社区的检测,是本文所研究的重点内容。如何从复杂的网络中识别关键的信息,发现其社区结构,有着极其重要的现实意义。社区结构作为复杂网络的一种重要特征,对于理解整个网络的结构特性、节点功
学位
目的通过诊察并对比多囊卵巢综合征患者与健康女性小腿段足三阴经的阳性反应,观察多囊卵巢综合征患者足三阴经的经络腧穴反应现象。方法以18-35岁的40例多囊卵巢综合征患者(多囊组)和35例健康女性(健康组)为研究对象,应用传统经络诊察法和人体压痛力学定量测试仪,分别于PCOS组和健康组的非经期诊察双侧小腿足三阴经阳性反应物(条索、结节、松软、凹陷等形态异常)及压痛的出现情况、以及测定压痛VAS值及压痛
学位
基于快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,DPC)被提出以来,由于其思想简单,所需参数少,聚类高效等优点被广泛应用。然而,随着对DPC算法的深入研究,一些问题和不足也逐渐暴露出来:截断阈值(9((8)难以确定、聚类中心难以准确选择、样本划分易导致连带错误、对具有复杂流形结构、类簇之间密度差异较大数据
学位
近年来,因为人类的步态即使在远距离低分辨率下也具有很强的辨别能力,所以步态识别越来越受到人们的关注。但不同视角下行人的步态图像序列差异较大,因此步态识别的性能易受到视角变化的影响,影响最终的识别率。针对这一问题现有的算法主要分为以下三类:步态能量表征模板、提取视角不变性特征、学习不同视角下的映射关系。而本文提出了利用图卷积网络来解决由视角差异引起的识别率低的问题。本文的主要工作和创新点如下:(1)
学位
复杂网络领域中,链路预测是其中一个关键的研究方向。链路预测就是根据网络的已知拓扑信息去预测网络中丢失的连边、潜在的连边或在未来某一时刻将会出现的连边,甚至可以找出网络数据集中错误的连边信息。目前,科学家针对链路预测问题提出了不同的算法。基于节点相似性算法分为基于局部信息的相似性算法和基于全局信息的相似性算法,局部相似性指标使用网络中局部邻居和结构信息进行相似性大小预测,计算复杂度低,准确度低;全局
学位
遥感图像语义分割旨在为遥感图像中的每一个像素点都分配相应的类别。目前基于深度学习的遥感图像语义分割已经在军事、地质、城市规划等领域出现了许多成功的应用案例,然而随着遥感图像应用范围不断扩大,给遥感图像的语义分割任务带来了许多新的难题,因此它仍是一项具有挑战性的任务,表现在:第一,遥感图像中的各类地物尺寸各异,尺度差异较大,若要准确地对地物目标的类别进行预测以及完整地对地物目标的边界进行分割,需要提
学位
三维目标检测是自动驾驶环境感知中的关键技术,可以为安全可靠的自主驾驶提供基础。激光雷达和彩色(RGB)相机是自动驾驶汽车上最重要的两个传感器,分别获取点云和图像。点云包含精确的距离信息,但稀疏且无序,进行目标检测时,对低分辨率或遮挡目标检测困难,存在误检和漏检的情况。图像包含RGB色彩值,具有纹理和边界等细节信息,但是因为成像时近大远小的特点,以及距离信息的缺失,在三维目标检测任务中无法估计出目标
学位
利用超分辨率算法获取高分辨红外图像是解决当前我国红外成像器件制造水平低导致成像效果差、成本高昂难以满足需求的一种有效途径。基于多视图像的超分辨率算法以其更好的成像性能成为研究热点,其中又以深度学习超分辨算法最受关注。然而,现有深度学习超分辨率算法训练时用的样本对对应的并非真实的红外图像降质过程,且忽略了高-低分辨率图像的相互配准问题,使得其在实际应用中效果不理想。针对这一问题,本文提出了一种基于自
学位