基于深度学习图像识别的研究及应用

来源 :电子科技大学 | 被引量 : 18次 | 上传用户:yht_816
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先借鉴残差学习的思想设计了恒等残差块和卷积残差块,并用它们构建了一个50层的残差网络,该网络在CIFAR-10数据集上的准确率只有84.83%。接着本文对此网络进行了改进,改进后的网络深度达245层,在CIFAR-10上的准确率高达93.99%。具体的改进工作如下:沿用了残差学习的思想,对恒等残差块和卷积残差块都做了改进。改进的恒等残差块由于设计上的创新可以将网络叠加得更深,并且不会出现网络退化。文中还对这种改进的合理性给出了数学上的证明。优化了损失函数。优化过的损失函数关于各个权重的偏导一直处于一个合理的范围,最大程度减小了参数更新异常。修改了初始化方法。本文在训练50层残差网络的时候,使用的是Xavier初始化方式。仔细阅读这篇论文之后,发现它的作者在推导这个公式的时候假设激活函数是恒等函数。而本文使用的激活函数ReLU并非恒等函数,因此本文基于ReLU函数对Xavier初始化方式做了修改,新的初始化方式可是让权重更新得更稳健,使网络收敛得更快,当然最终训练出的模型准确率也更高。仔细观察本文改进前的50层残差网络和改进后245层残差网络,可以惊讶地发现,245层的网络比50层的网络参数量还要小,这得益于本文对网络整体架构的改进。本文巧妙地使用1×1和3×3的卷积核,既通过设置卷积核的滑动步长和Padding来调节特征映射的大小,也通过指定卷积核的个数来控制特征映射的通道数。这几个超参数和网络的参数量有着莫大的关联,正文中会详细讲到。同时本文对池化层的安放也很有研究。因为自然图片中的物体都具有局部不变性特征,也就是说卷积输出的特征映射中相邻两个点的特征通常会很相似。为了把语义上相似的特征合并起来,我们可以使用特征映射中一个区域中的最大值,或这个区域的平均值来代表这个区域的特征。这样就可以有效降低特征映射尺寸大小,同时还不会增加额外的参数。本文在训练网络的过程中使用MXBoard实时显示训练集和验证集上的损失值和准确率,以便观察网络状态。本文最后还实现了一个基于改进残差网络的交通标志识别系统。
其他文献
为探讨岩溶洞穴波状流痕(舌状流痕)的分布特征及形成原因,对观音洞内的波状流痕的形态特征参数进行测量,统计它在纵、横方向上的展布特征,分析洞道形态结构与波状流痕的展布
针对目前公路工程应用沥青路面施工技术过程存在的问题,文章从实践角度出发,分析了施工技术的应用现状,并提出了优化控制的方法对策,其目的是为相关建设者提供一些理论依据。
煤炭企业为满足提升安全管理水平,扩大生产能力的需要,企业每年都需要投入大量的资金进行设备更新和技术改造。从煤炭企业自身发展的情况来看,煤炭企业仅靠提高价格和产量的
全球化与快速城市化背景下,中华大地上的文化遗产受到了前所未有的威胁与破坏,特别是在国家历史上对政治经济发展、社会进步与文化交流发挥过重要作用的线性文化遗产,亟待引
对10只犬实施肾脏摘除手术后,通过血液生化分析检测,观察手术前和手术后血液中钙、磷的含量变化。结果表明:血钙含量在手术前与手术后的各个采血时间点(24h、72h、96h)相比差
目的讨论肺动脉高压患者的护理。方法配合右漂浮导管检查术、用药治疗等方面进行护理。结果按照医嘱给予钙离子拮抗剂、内皮素拮抗剂、磷酸二酯酶抑制剂、依前列醇及其类似物
加缪作为存在主义哲学家、文学家,其哲学思想与文学作品在西方思想史和文艺界上有重要影响。加缪的荒诞理论以及后续的反抗哲学,成为了第二次世界大战后哲学思潮里的中流砥柱
<正>我是二〇〇八年左右开始接触草书字法研究的,忽忽已近十年。那时我刚从南京艺术学院硕士毕业,来到淮阴师范学院书法专业任教。古人云"教学相长",这是一点没错的。我在教
提出了"与生活相关的化学素养"概念,并对其功能化构成模型进行了探讨和实证。
植物类课程是目前许多院校的风景园林、 景观设计和环境设计等相关专业开设的专业基础课, 然而不同学科背景对于植物类课程的教学内容及教学目标侧重点各不相同. 艺术类院校环