基于高阶信息的特征提取算法及其在图像识别中的应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:szywit01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的迅速发展,图片数据的规模已有着指数级增长的趋势,影响图像识别算法的数据的维度、复杂度及多样性等因素也今非昔比,所以利用特征提取算法从如此大规模的高维度数据中获取最有效的特征信息仍是近年来的研究热点。然而大多数的特征提取方法只关注数据的一阶局部结构信息,显然无法应对现实中高维且复杂的图像数据。近年来,高阶信息受到了学者们的关注,它能表达出数据更具判别性、更本质的结构,从而在特征提取时发掘高阶结构对提高图像识别的性能是十分有意义的。本文针对图像识别中的不同任务和场景,提出三种基于高阶信息的特征提取算法。首先,为了同时利用数据中的全局信息和高阶局部信息提出了一个基于低秩表示的特征提取算法。全局信息是通过模型中的低秩约束来实现,同时该约束还能使模型避免受到噪声和离群点的影响,提高模型的鲁棒性。局部信息则是通过基于图的流行嵌入来实现的。通过构建一阶、二阶图矩阵使得模型能同时保持样本间的对结构和有序结构。在十个公开的图像数据集上进行的对比实验证明了本方法相对于传统及最新方法在识别准确率指标下有着明显的提升。其次,为了解决多模态数据中的不平衡问题而提出了自步有序保持算法。从特征层面来看,该算法利用了二阶拉普拉斯流形嵌入使得不同模态数据的有序结构保持到新的投影空间中。从样本层面来看,我们设计了分别针对多数类和少数类的自步学习策略,将参与学习的数据从类别平衡的子集动态地扩充到整个集合,减少不平衡类别对模型学习的负面影响。同时,在投影矩阵上施加的组稀疏约束可以发掘不同模态之间的潜在关系模式。在多模态图像数据集913-ADNI和癫痫数据上的实验结果表明,本文提出的方法能达到很好的分类和诊断效果。最后,考虑到传统的模型不能直接识别出来自新类别的样本,即无法适用于零样本识别,本文提出了针对该场景的语义引导的高阶区域注意力嵌入模型。该模型以端到端的方式进行训练,能够利用不同的注意力模块获得全局特征和局部区域特征。最后的二阶池化操作能提取出两种特征的二阶信息。在零样本任务常用的四个数据集上的实验表明,本模型在零样本学习任务中可以取得理想的分类结果。
其他文献
随着信息技术的发展,各个领域每天都在生成海量数据。面对爆炸式增长的数据,传统的数据挖掘已经难以胜任当前的数据流环境。如何快速从数据流中挖掘出价值信息成了数据挖掘领域的研究方向之一。与传统的静态数据相比,数据流具有有序性、高维性、高速性、动态变化性以及数据规模庞大等特点,尤其在现实场景还存在着概念漂移、数据流标签信息难以获得等问题,使得已有的分类算法无法有较好的效果。因此,在数据流的环境下,对概念漂
学位
传统面条由精白小麦粉制作而成,其血糖生成指数(glycemic index,GI)较高,不适合糖尿病等慢性疾病患者食用。本课题旨在研究制备一款GI值较低的主食面条,为这类慢性疾病患者提供一种有效的食物选择。本论文从影响GI值的因素入手,研究适宜的原辅料对面条品质和体外预测GI值(expected glycemic index,e GI)的影响,以期在满足面条品质的基础上尽可能降低面条e GI值;同
学位
目的 :探讨人唾液外泌体(saliva-derived exosomes,S-Exos)对大鼠皮肤损伤修复的影响。方法 :收集健康成年人唾液,分离并鉴定唾液外泌体。将18只SD大鼠随机分为对照组、唾液处理组和外泌体处理组。通过皮肤打孔法制备大鼠皮肤全层缺损模型,各组在建模后48 h时于创面边缘分4点进行皮下注射给药100μL。在建模后第0、4、8、12、14天时观察各组大鼠创面愈合情况,计算伤口愈
期刊
秘密共享是密码学领域中一种重要的技术,提供了一种与众不同的方法来保护不同参与者之间的秘密。自从秘密共享技术被提出之后,许多著名的学者对此进行了深入的研究,并取得了很多有效的成果。秘密共享技术不仅解决了关键密钥的保存问题,同时也避免了权力的过于集中。目前秘密共享技术在许多方面已经得到了广泛的应用。本文首先对现有秘密共享技术的相关工作进行了一个总结,在此基础上以基于计数的秘密共享计数、可验证秘密共享为
学位
软件可追踪性是指在软件开发过程中创建和维护制品(例如需求和代码)间的关联关系(也被称作追踪链),并利用这些关联关系对软件项目进行一系列分析的能力。软件可追踪性的主要目的是当软件制品随版本演进而发生变更时,可以通过追踪制品间的关联关系来确定软件制品功能变化的范围和影响,如支持变更影响分析、依赖影响分析、系统验证以及安全认证等活动。在实际的软件开发中,人们最为关注的一类软件可追踪性是需求到代码的可追踪
学位
当今时代是一个视频数据爆炸的时代,互联网上每天都会产生大量且冗余的视频数据。视频概要——即将视频转化为若干包含其关键信息的视频帧,不仅节省了原视频所占据的存储空间,并且也方便用户了解原视频的内容,是数据检索和机器学习领域中的一个重要的研究方向。现有的解决视频概要的典型算法如行列式点过程(Determinantal Point Process,DPP)能够很好地刻画视频帧的代表性和多样性。但是现有的
学位
写作教学是中学语文教学中最重要的环节,写作水平的高低、作文成绩的好坏,不但直接影响学生的语文成绩,更直接彰显了学生的语文素养。笔者尝试以阅读为依托,借助思维导图进行项目化写作教学,从而促进学生的深度学习,逐步落实并提升语文的学科核心素养。
期刊
随着全球海洋运输业的日益发展,船舶自动识别系统的信息阻塞等问题愈发突出,碰撞预警漏报概率大幅上升,严重影响航行安全,在保留原有系统体系功能的基础上,增加专用报文和甚高频数据交换功能的甚高频数据交换系统应运而生。概述了甚高频数据交换系统产生的背景和系统组成,介绍了系统在国内外的发展现状,阐述了相关国际标准的制定情况并给出对策。
期刊
随着定位应用越来越广泛,定位技术的研究在近年来得到更多的关注。现有的研究工作大多集中在对已有方法提出一定程度的改进,以此提高定位精度和准确率。首先,在室外条件下,全球定位系统的定位精度已经能够到达了1m以内,而且系统使用十分便捷,已经能够满足室外条件下绝大多数位置应用的需求。在室内环境下,许多应用需要低成本、低复杂度的方式实现室内定位,例如室内扫地机器人的定位,商场基于位置的购物推荐以及飞机场用户
学位
三维视频和自由视点电视(3DV/FTV)作为新一代数字视频技术,因其能够提供更广的观看自由度、沉浸式的视觉效果以及灵活的交互功能,而受到工业界和学术界的广泛关注。虚拟视点合成技术由于其能够减少3DV/FTV传输的视点图像数量,已成为三维视频(3-D)研究的核心部分。最常用的虚拟视点合成技术是使用纹理图像及其相关深度图的DIBR(Depth Image Based Rendering,基于深度图的渲
学位