基于张量分解的高维数据鲁棒核低秩表示算法研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:mkkkj2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,数据交互变得更加频繁,数据规模越来越大,结构也越来越复杂,如文本数据、图像数据、生物数据等,分析这些数据并得到对人们有用的信息,具有重要的现实意义。低秩表示(Low Rank Representation,LRR)作为一种经典的数据处理算法,可以很好的处理数据矩阵,并且能够对数据进行有效的降维,对噪声更鲁棒,当数据存在损毁时,LRR算法对数据具有很好的恢复作用,因此,算法自提出以后在很多领域被广泛应用。虽然低秩表示理论日趋成熟,但仍然存在一些不足。在基于核函数的低秩表示算法中,算法只能处理单一特征的非线性数据,当数据具有多个特征属性时,该算法并不能很好的处理。但是在现实生活中,人们需要处理的数据往往具有多个特征属性,传统的核函数低秩表示算法往往将这些数据转化为向量或者矩阵的形式,这不仅会破坏数据的空间结构,而且会丢失数据中的部分信息,导致数据分析不准确。针对传统的核函数低秩表示算法无法处理高维数据多特征属性问题,本文提出基于张量分解的高维数据鲁棒核低秩表示算法(Kernel Low-Rank Representation of High-Dimensional Data by Robust Tensor Decomposition,RTDKLRR)。一方面,通过构造高维数据,从而将数据张量表示,并将数据进行Tucker分解,保证数据的完整性;另一方面,利用核函数将分解后的非线性数据映射到新的特征空间,保证数据的线性可分。论文对RTDKLRR算法进行了理论分析和详细的推导,并基于交替方向法求解出算法的最优解。本文构造了模拟数据集和真实数据集对算法的有效性进行实验,并在数据集中掺杂噪声,验证算法对噪声的鲁棒性。本文采用聚类错误率作为算法的评价指标,将本文算法和现有的研究工作进行实验对比,验证本文算法的合理性。
其他文献
自2016年以来,中国家电市场趋于饱和,越来越多的家电企业加入海外并购大军,如海尔并购通用家电,美的并购东芝家电、库卡等。2018年普华永道发布的《中企并购市场中期回顾报告
通过在气候干旱的10~11月、低温的1月及种植后2个月3个桉树苗移栽时期进行力源富桉壮苗肥的施用试验,结果表明:与常规方法、空白处理效果对比,用富桉壮苗肥的桉树苗平均株高分别
简要介绍了近几年梧州市农业经济发展概况及存在问题,分析了制约梧州市农业经济发展的瓶颈因素,提出了坚持比较优势战略,增强发展紧迫感;增加农业投资,规范投资管理;转变生产经营方
随着中国改革开放的力度不断加大,越来越多的国家开始将汉语纳入国民教育体系,因此也亟需更多的汉语教师,其中汉语教师志愿者是目前主要的汉语师资力量,因而志愿者群体跨文化适应研究逐渐成为学者关注的焦点。本文以赴蒙汉语教师志愿者为研究对象,采用文献研究法、问卷调查法、统计学软件SPSS统计方法来研究赴蒙志愿者跨文化适应状况以及跨文化适应相关影响因素。全文共分成四章,主要内容如下:第一章主要介绍本文的研究背
高中物理课程标准在义务教育的基础上,为进一步促进学生物理学科核心素养的养成和发展,要求学生达到相应的课程目标。在“科学思维”方面要求学生具有以批判性思维处理问题的意识;在“科学探究”方面要求学生反思探究过程与结果。研究者们逐渐意识到,在学习中培养学生学会质疑,具备质疑意识、质疑精神以及质疑能力能够促进学生的思维发展。随着社会现代化的发展,培养创新型人才成为时代所需,全面落实素质教育成为时代的号召,