论文部分内容阅读
商品识别技术是现代零售业的核心技术之一。相比于传统商品识别方法,基于计算机视觉的商品识别具有快速、准确、成本低等优势,有广泛的应用前景。现阶段大多数商品图像识别算法主要基于图像分类网络,在实际应用中存在商品类别无法灵活更改、商品类别数量受限以及缺乏类别泛化能力等问题。为了快速准确地识别商品,同时避免以上问题,本文研发了基于图像检索的商品识别算法,具有较高的工程应用价值。本文研发的商品识别算法分为特征提取和特征匹配两步。首先研发了基于度量学习的特征提取网络,采用预训练的骨干网络从商品图像中提取丰富的全局信息,由特征提取模块映射成特征向量输出。改进三元组损失监督特征提取过程,加强了特征的区分性,同时添加分类监督使网络训练更快更稳定。在此基础上研发了基于多分支结构的特征提取网络,设计多分支结构将骨干网络提取的全局特征先拆分再映射,以编码不同的图像信息到多个特征向量。联合多个特征向量进行特征匹配,提升了算法的鲁棒性与精度。之后本文研发了特征匹配算法,该算法结合特征的余弦相似度计算和排序,将查询商品与注册商品进行匹配,得到商品识别结果。在100类商品的36995张图片上测试,基于度量学习的模型识别准确率达到了 98.65%,单张图像(分辨率为224×224)识别耗时仅15.1ms;基于多分支结构的模型单张图像识别耗时31.6ms,准确率高达99.14%。本文将上述商品识别算法应用在货架场景,并研发了货架商品检测与识别算法。针对货架商品摆放密集、小目标多等特点,首先对Faster R-CNN目标检测算法做出四点改进以适应货架商品检测,包括更换骨干网络、使用特征金字塔结构、采用RolAlign代替RolPool、使用K-means优化锚点设置。然后改进基于多分支结构的特征提取网络,加入特征压缩支路以产生低维特征向量,并结合多分支结构产生的高维特征向量进行特征匹配,实现了货架商品识别的速度和精度提升。经过测试,改进的Faster R-CNN算法精确率达99.21%,漏检率仅为1.37%;改进的商品识别算法在448类商品上的准确率高达99.29%,单张图像识别仅耗时 17.1ms。