度量学习及其研究应用

被引量 : 0次 | 上传用户:allench9484
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
距离度量学习的主要任务是学习数据间的距离和相似度,而对于分类、聚类、识别等机器学习与模式识别的基本任务都是基于数据上的距离度量展开的,因此距离度量学习对于解决机器学习与计算机视觉领域中的实际问题有重要的研究与应用价值。距离度量学习根据学习样本是线性还是非线性,主要分为线性距离度量学习与非线性距离度量学习两类。线性距离度量学习适用于低维线性空间,非线性距离度量学习则适用于高维的非线性空间,其保持了高维非线性数据的低维嵌入流形,因此又称为流形学习。由于现实世界和实际应用中绝大多数的数据是高维非线性的,因此本文的研究重点主要集中在流形学习方面。本文围绕经典的流形学习算法,针对黎曼流形、全局特征信息与局部特征信息和权重距离度量等方面进行研究,提出改进算法并应用于人脸图像识别和高维数据可视化。主要贡献如下:1.从理论知识出发,具体介绍了度量学习经典算法的基本思想和具体步骤,并给出了各自算法的优缺点。然后后通过高维数据模型的可视化实验,对四种经典算法进行了分析与对比。2.针对黎曼流形学习(RML)不能消除图像矩阵的高阶相关冗余信息影响识别效果的问题,引入Log-Gabor滤波器提出了Log-Gabor+RML算法。该算法融合了Log-Gabor滤波良好的表征能力与黎曼流形学习较好的人脸流形保持能力。进一步深入研究发现,Log-Gabor滤波符合人眼的非线性对数特性,适合对自然图像进行处理,同时黎曼流形学习与神经生物学人类的视觉感知是基于流形的这一理论相符合。因此两者在步骤上的融合与人类视觉感知过程顺序相一致,在多个光照人脸库上也获得较好的识别效果。3.基于流形学习核的视角,提出融合流形全局特征信息与局部特征信息的多信息流形学习算法。该算法融合了等距离投影算法(ISOMAP)与局部切空间对齐算法(LTSA)的核矩阵,可以同时保持流形结构的全局特征与局部特征,在人脸图像识别与数据可视化等应用方面获得了比基于单一特征信息的流形学习算法更好的实验结果。4.针对大多数流形学习算法不能处理样本点分布不符合正态分布、密度不均匀的问题,引入CAM权重距离度量替代传统的欧氏距离度量,改进LLE算法原有的近邻点选择方法,提出CAM-LLE算法。CAM权重距离可以使得样本点密度较密集的部分权重较小,从而减少特征信息的冗余;对于样本点较稀疏的部分,可以赋予较大的权重,将这部分特征信息充分的利用。高维数据的可视化实验验证了CAM权重距离度量更适用高维非线性的空间。
其他文献
提出了在字长限制下,按方法U1={aui-1}实际生成的伪随机数序列的周期计算公式;通过理论分析与数字实例表明该方法可在REAL*8之下普通的随机模拟问题,但不宜在大型模拟问题中使用。
<正>贸易摩擦增加中国经济发展的不确定性在短短不到一年的时间里,中美贸易摩擦已给中美这两个全球最大经济体的经济增长带来了巨大的不确定性。一方面,贸易摩擦直接给中国和
自上世纪90年代以来,巴彦淖尔市将番茄产品作为带动经济增长的重点产业,利用当地适宜的自然条件,引进种植优质的原料番茄,并在短短几年中吸引了多家国内大型番茄食品加工企业
在全面建成小康社会、全面深化改革、全面推进依法治国、全面从严治党的新形势下,社会主义核心价值观教育具有深刻的思想内涵和重要的时代意义。科学有效地改进大学生价值观
当今社会是手机媒体高速发展的社会,随着数字信息技术、移动通讯技术的快速发展,手机媒体的应用也愈加广泛。微信作为新兴的手机媒体和即时通讯应用软件,正不可阻挡的改变着
<正>今年是改革开放四十周年。作为改革开放重要成果的中国证券市场,以1990年12月19日上海证券交易所开业为起点,迄今已经走过了二十八年的历程。作为上海证券交易所的主要创
《八旗文经》是由晚清名士盛昱与其表弟杨钟羲共同编辑而成的一部八旗文章选集,内容丰富、所涉甚广,汇集了大量有关清代的政治、经济、历史文化、风俗民情、学术思想、地理沿
<正> 在日常工作中,我们不难发现这样的现象:有些班主任在班级工作取得成绩的时候,工作积极性很高,各项工作开展得井井有条;但当工作中遇到挫折的时候,就可能灰心、沮丧。工
期刊
当前,现代信息技术突飞猛进,新媒体正改变着大学生的思维方式、沟通方式、表达方式以及人际交往方式,他们的世界观、人生观、价值观都被深深地打上了网络的烙印。我们必须清