基于多级卷积特征金字塔细粒度食物图片识别与移动端应用

来源 :长安大学 | 被引量 : 1次 | 上传用户:nana119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
食物与人类生活息息相关,是保证人类身体正常运转的主要能量来源。将计算机视觉技术与食物识别相结合可以极大促进生活的便利性。食物图片结构多变、背景干扰大、类间差异小、类内差异大等特点,使其比普通细粒度图片的识别难度更大。目前在食物图片识别领域,大量工作从不同的角度对食物识别方法进行了全面的研究。但是作为食物识别领域最基础的食物图片精确识别与分类目前仍存在识别精度低、泛化性差等问题。本文提出了基于多级卷积特征金字塔的细粒度食物图片识别模型,由整体到局部逐级提取特征,不仅避免了之前方法仅仅关注食物图片整体特征的缺点,而且保留了全局信息和局部细节信息,将干扰较大的背景信息丢弃,只针对食物目标区域提取特征。本文模型主要由食物特征提取网络、注意力区域定位网络与特征融合网络三部分组成,分别负责特征提取、细粒度局部区域定位与全局局部特征融合。单级食物特征提取网络无法同时获得食物图片全局与局部特征,因此采用三级食物特征提取网络级联的结构实现了特征由全局到局部的转移。针对食物图片尺度变化大的特点,在每级食物特征提取网络的特征图之间构建了特征金字塔网络,提高了网络的特征描述能力,在加入特征金字塔以后模型获得了2.1%的性能提升。为了使网络自动定位到细粒度区域,在每级特征提取网络之间设计了一个注意力区域定位网络,将特征提取范围由全局缩小到局部。然后将原始图片的细粒度区域裁剪、放大输入到下一级特征提取网络。最后将每一级特征提取网络提取的特征送入特征融合网络进行特征融合,融合后的特征既包含食物图片的全局特征,也包含食物目标的细节特征。实验结果表明,本文模型在Food-101、ChineseFoodNet与Food-172数据集上分别获得了91.3%、82.6%、90.1%的Top-1正确率,超过了当前最好的识别结果。同时本文还建立了一个类别更多、数据量更大的食物图片数据集。
其他文献
目的:探讨不同锌离子浓度喂养孕鼠对子代腭胚突融合期细胞增殖的影响;观察不同锌离子浓度喂养孕鼠后Sp家族基因(Sp8、Sp5)的表达水平,验证Sp家族基因与腭裂发生的相关性,为后
目的评价低分子肝素(low molecular weight heparin LMWH)联合化疗治疗非小细胞肺癌的应用价值。方法收集了2014年1月至2017年3月诊断为非小细胞肺癌的115例患者;通过门诊复
民国时期物理学体制化的发展史就是一部归国物理学留学生的奋斗史。本文以“民国时期物理学体制化”和“民国时期物理学留学生”两条线索贯穿始终,在民国时期留学活动的大背
由于化工行业下游需求驱动以及成本管理的有效加强,化工企业业绩有所回升。更多的企业力求抓住这次良好的市场环境,突破以前陈旧的内部管理局限,寻求更高效的管理方法。从成
<正>贵州以实施大数据战略行动为契机,运用大数据手段提升党建科学化水平,着力打造"智慧党建"。大数据时代,党建工作如何顺应潮流、与时俱进?贵州用心作答。党建红云、社会和
<正>软骨肉瘤是发生于软骨细胞的恶性骨肉瘤。由于软骨肉瘤对放疗、化疗不敏感,手术完整切除成为唯一可能治愈的方式[1]。当胸骨的软骨肉瘤涉及深层肌肉组织及骨性支架层时,
应收账款管理直接影响到企业的经营资金周转及其正常的经营活动。目前,许多企业因未对应收账款采取有效的事前、事中和事后控制,导致资金紧张。本文从经营管理全局的角度出发
运用问卷调查法等,对杭州市居民运动休闲时间与空间进行研究。主要结论:杭州市居民运动休闲时间和空间存在一定联系,在不同的休闲时间,居民对于运动休闲空间的选择有所差异;
目的:采用事件相关电位(Event-Related Brain Potential,ERP)探讨头针顶颞前斜线中2/5治疗脑卒中的即刻效应机制。方法:选取符合纳入标准的脑卒中患者30例,健康人25例,两组均
<正>随着市场经济的不断发展,竞争越来越激烈,企业以商品信誉的形式赊销商品变得越来越普遍,这样就不可避免地发生应收账款。一、应收账款对企业的影响1、对企业有利的影响是