基于深度学习的菜品图像分类方法研究

来源 :电子科技大学 | 被引量 : 11次 | 上传用户:shaoyan_8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
菜品图像分类在智能健康管理中扮演着重要角色。随着软硬件技术的不断进步及人工智能理论的持续发展,菜品图像分类将在辅助生活、社交娱乐中具有更高的实用性和普遍性。菜品分类作为精细图像分类的一个子课题,利用图像细节以及寻找可判别区域在学术界与工业界得到广泛关注和研究。本文针对这两个关键任务,面向常见的90类菜品图像,研究三种新的菜品图像分类算法。文章主要内容如下:1.本文研究一种基于多尺度思想的菜品图像分类算法,包括多尺度输入图像和多尺度CNN特征谱两个方面。在多尺度输入图像方面,本文利用两种不同尺度的输入图像训练CNN分类网络,两个尺度不共享网络参数;在多尺度CNN特征谱方面,首先将低层、中层特征谱进行加权融合,再将中层、高层特征谱进行加权融合,最后进行分类。这种基于多尺度思想的方法可以更好利用图像细粒度信息,弥补了随着CNN网络层数增多,细粒度信息丢失的缺陷。2.本文研究一种基于可判别区域的菜品图像分类算法。针对菜品图像背景多为餐桌、桌布的特点,首先对菜品图像进行餐具分割,排除背景图像干扰,以确定菜品区域二值图;同时提取菜品图像的显著谱,比较菜品区域二值图和显著谱的交并比关系,以得出最终的菜品图像可判别区域;最后,通过对可判别区域提取CNN特征实现分类。3.本文研究一种基于注意力模型的菜品图像分类算法。针对菜品图像构建本文的注意力提取模型,并将其运用到本文CNN网络的后端,以得到菜品图像的注意力特征谱;随后利用注意力特征谱对原特征谱进行改进,以实现对注意力区域的增强;同时,采用卷积特征谱和全连接特征谱级联的方式,弥补CNN网络在后端对图像空间信息的丢失。为了训练本文算法模型并验证其有效性,文章从菜谱网站爬取用户上传的图片,构建CF90数据库。为了取得更好的分类效果,本文每一章算法不相互独立,均基于前面提出的算法,不断改进。实验结果表明本文算法能逐步提升菜品图像的分类准确率。
其他文献
数字水印是信息安全技术的一个重要分支,是解决多媒体信息众多安全问题的一种有效途径。稳健性是数字水印研究中的关键问题之一,稳健图象水印算法是近年来数字水印领域中十
网络教育以其范围广、易推广、有良好交互性等优点正得到越来越广泛的应用。但现今的网络教育系统在试题的多样化和认证的安全性方面还存在着一些不足,对此作者通过理论分析
随着计算机技术、光学扫描技术和半导体技术的发展,指纹识别的自动化得以实现,相比较一些传统认证技术,自动指纹识别显现得更安全、更优越,并广泛地应用于各种信息安全领域。在指
目的:关于小儿感冒发热的观察与护理效果分析。方法:选取48例,感冒发烧的儿童,作为研究对象,分成对照组、观察组两组,各24例患者,对照组患儿采用的是常规的护理,观察组患儿采用的是综
[目的]:探讨高血压合并糖尿病的社区护理措施及效果。[方法]:选取本社区2012年1月~2015年12月临床确诊为高血压合并糖尿病的72例患者为临床观察研究对象,将其随机分成观察组36例(
分形现象是自然界中普遍存在的一种现象。它反映了系统在演化过程中,不同时期状态的相互关系以及系统整体和局部之间、局部和局部之间的关系。关于脱氧核糖核酸(DNA)序列分形
  本文首先介绍了移动定位技术的历史及发展概况以及蜂窝移动通信系统的定位原理,重点阐述了非视距(NLOS)误差的鉴别与抑制。接着详细讲述了WCDMA网络标准的CellID、OTDOA、
本文首先对分布式异构环境下对象及数据共享技术进行了分析,探讨了互联网中多种远程教育资源实现共享的各种可行技术,然后对WebService技术进行了详细的论述,说明了应用WebServi
  随着各种通信网络的发展,网络融合技术一直是业界研究的热点问题。尤其在无线通信领域,将逐渐成熟的AdHoc网络与传统的蜂窝网络结合起来,互相取长补短,已成为改善网络性能,节
全球信息化已成为人类社会发展的大趋势,信息技术的研究和应用日新月异。与此同时,信息系统的安全问题也逐步得到社会的重视,加强信息安全技术的研究和应用成为一个长期而持