论文部分内容阅读
近年来,深度学习引起了各界的广泛关注,并在图像领域取得了不错的成果。目前,大多数基于深度学习的图像识别模型都是在计算机上运行的,针对移动设备的资源有限,本文提出了一个具有实时性、模型小和高准确性特点的图像识别模型。最后将模型移植到了安卓应用中,并开发出了一个图像识别APP,经测试,该APP具有良好的识别率和一定的应用价值。本文的主要工作如下:(1)提出了一种基于卷积神经网络的图像识别模型。通过分析LeNet-5模型、AlexNet模型和NIN模型的特点,针对移动设备资源有限的问题,设计了一个参数少、处理时间短和高识别率的图像识别模型。该模型采用五层卷积层对图像特征进行提取,全局均值化代替全连接层,减少了模型的参数个数和处理时间。通过对数据集的随机变换处理,将识别率提高了 2%。对比LeNet-5网络,该模型识别率提高了 11%。与AlexNet模型相比,本模型识别率提高了 2.12%,参数是AlexNet模型的1/13,训练时间是AlexNet模型的1/4。与NIN网络相比,虽然识别率低了 2.04%,但训练时间是NIN网络的1/5,参数是NIN网络的1/3。(2)开发出了一款本地实时预测的图像识别APP。通过NDK工具将训练最优的模型编译生成.so的动态链接库,Android应用层从相机获取图片并转换为bitmap格式,将图片裁减到32×32像素大小及归一化处理后,转换为四维的浮点型数组,调用JNI接口,将图片数据传给预训练模型,运行模型,然后定义一个数组接收模型的预测结果并在界面上显示出来。该APP界面可以显示图片预览图、识别结果及处理时间等。测试结果表明,可以对物体从不同角度进行拍照识别,识别率平均可达到92%,图片识别的平均耗时为23ms,满足了准确性、实时性的要求。(3)对本文提出的图像识别模型进行了优化处理。将训练最优模型的权重变量值固化为常量值,和描述模型结构的文件结合生成安卓设备可以直接调用运行的.pb文件。预训练模型中的一些节点在应用中可以移除掉,通过把模型中的这些节点删除,将模型减小了 1K大小,最终优化后的模型只有1.1M,比NIN模型少了 2.6M,比AlexNet网络少了 13M,可以移植到绝大部分的安卓设备中。测试结果表明,优化后模型的识别率与优化前的识别率相同,没有明显的降低。