基于有监督预训练NIN和深度ELM模型的图像识别算法研究

来源 :南京航空航天大学 | 被引量 : 1次 | 上传用户:xjc132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于机器学习的图像识别技术得到了广泛的应用,并在多个领域发挥着极其重要的作用。相对于其他数据来说,图像中包含的信息量巨大而冗余。众所周知,机器学习方法的性能很大程度上取决于数据特征的选择,因而构建一个好的图像识别系统往往需要拥有一个较好的特征提取器,将原始数据转换成合适的特征表示或特征向量,以帮助分类器正确地进行图像的识别。以往的图像识别方法大多采用人工提取特征的方式,其设计过程不仅困难,而且需要相当的工程技巧和问题领域的专业知识。深度学习是一种允许机器自动从原始数据中学习到特征表示的方法,通过组合那些能够将某层特征表示转换到更加抽象的高层特征表示的简单非线性模块,深度学习方法能够学习到多层特征表示。对于分类任务来说,高层的特征表示能够放大输入中具有判别信息的部分,同时忽略输入中不相关的因素,从而提高分类性能。将深度学习用于图像识别问题已经成为图像识别领域的研究热点,并且取得了非常好的效果。本文提出了MPNIN模型用于解决图像识别问题。NIN模型使用了一种称为mlpconv层的非线性卷积层代替传统CNN模型中的线性卷积层,能够增强模型的非线性拟合能力。MPNIN模型的的主要思想是基于mlpconv层的有监督预训练,与传统的逐层有监督预训练算法有相似之处,但与传统逐层有监督预训练相比,基于mlpconv层的有监督预训练可以避免前者所存在的由于非线性表达能力不足而导致的过于贪婪的问题。另外,MPNIN模型中的有监督预训练为各层提供的监督信息能够有效抑制深度模型中常见的梯度弥散问题。尽管MPNIN模型已经取得了比较优越的识别效果,但CNN本身是一种训练过程非常慢的算法。针对CNN训练时间过长的问题,本文提出了R2CELM和R2ELM-LRF模型,这两者将ELM和堆叠泛化理论结合起来构建深度模型。ELM算法的学习速度非常快,具有优越的泛化性能,并且可以有效的解决局部最小值和过拟合问题。特别是其中的R2ELM-LRF模型是一种将基于局部感受野的特征提取与ELM相结合的算法,具有识别图像中局部相关性结构的优势和ELM不需要反向传播调整权值的优点。实验表明,新提出的模型不仅具有较好的识别性能,同时其收敛速度较常用的其他深度学习算法有很大提高。
其他文献
为评估太湖生态系统供水服务价值,以资金、劳动力、总用水量为自变量,以GDP为因变量,建立了太湖供水C-D生产函数。利用太湖下游地区苏州市1993-2007年统计资料,计算出2000年苏州
建筑电气工程中漏电保护技术的作用不容忽视。当前,我国科技水平不断提升,漏电保护技术也得到了大力推广与应用。但是在实际操作中,仍存在明显不足之处,为了有效提高电气工程
广两优15是黄冈市农科:选育的两系杂交中稻新品种。该品种生长势强,株型紧凑,穗大粒多,米质优,是难得的两系中稻新品种;主要介绍了广两优15的品种来源、农艺与生物学特性、品
教育改革是以提高教育质量为目标的,而课程群的建设质量直接关系到人才培养的质量。在现有的高校服装专业课程体系下,突破传统的专业基础课与专业课的框框,构建了服装艺术设
近年来,许多城市选择在地铁车辆段上方建设物业开发保障性用房,用来缓解城市用地紧张的状况,以满足城市人口的住房要求。由于地铁车辆段柱网稀疏,开间比较大,而车辆段上部住
王符作为东汉中后期著名的政论家和思想家,受汉末特定历史环境的影响,其理论观点和学术思想表现出以儒融道、儒道融合的思想特色。本篇论文结合东汉后期儒道融合思潮的特征和影
在现代车身设计中,通常是用结构优化和材料更替来实现轻量化的设计目标。具体地说,基于有限元的设计方法,在整个概念设计的优化阶段,需要对整体拓扑进行优化,在基础结构的设
在智能交通领域,汽车防撞雷达系统作为一项主动防撞措施,对实现自动驾驶、降低交通事故发生率具有重要的现实意义。汽车防撞雷达多目标跟踪技术能够在道路杂波环境实时估计车
中国传统文化课程是进行大学生思想政治教育的强大阵地。中国传统文化内容博大精深,在教学中,存在重点内容选择、教学方法探索、传统性与现代化结合、理论性与应用性结合等问题
为建立科学、合理、公平且可行的两部制水价,为跨流域水利供水工程收费模式的制定提供理论指导与方法支持,对关键参数基本水量的各种确定方法进行了系统阐述,对其优缺点进行