论文部分内容阅读
随着信息技术和成像技术的快速发展,图像信息量迅速的增长,在科学研究以及商务应用领域对图像内容信息的需求也愈发强烈,对于用户而言,快速从海量的图像库中找出感兴趣的图像非常困难,因此,出现了图像推荐研究方向。深度学习(DL,Deep Learning)是计算机科学机器学习(ML,Machine Learning)领域中一个新的研究方向,其最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。本文将深度学习方法与图像检索推荐相结合进行研究,使得结果仅仅和图像本身的内容相关,而尽量降低基于文本的图像推荐方法中的人类主观因素影响和图像的拍摄环境及拍摄设备影响。本文调研了深度学习相关的发展历程和最新的研究成果,分析了当前图像推荐系统所使用的相关技术,以及存在的问题。基于深度学习的多重非线性变换的特性,以及对图像的多层次抽象能力,将深度学习理论中的卷积神经网络(CNN,Convolutional Neural Network)应用于电子商务图像识别领域,对卷积神经网络应用到图像推荐系统中的搜索性能进行了研究分析。本文的主要工作如下:1.带标签的图像数据获取研究爬虫实现方案,采用爬虫技术,获取国内主流电子商务网站上的商品图像及相关的网页文本,研究解决网页增量爬取和URL去重等问题的方法,对非结构化的网页文本进行实体提取并进行结构化的存储和索引,同时基于网页文本信息对图像进行标记。2.深度学习方法在图像推荐中的应用电子商务图像的信息种类繁多,且背景复杂,而搜索图像的内容会受到拍摄环境和拍摄设备的影响,本文使用深度学习技术的方法进行图像内容特征提取。该深度学习方法通过多重非线性变换获取图像的多层特征,并使用经过训练的深度学习模型以模拟人类视觉系统理解图像内容过程,将图像特征以更接近人类视觉感受的抽象特征表示出来,不仅可以有效防止商品图像背景内容的干扰,而且能够抵抗各种形变、尺度变换、颜色变换,可以有效提高在输入无标签图像时的搜索精度。3.大规模图像索引和检索推荐方法本方法将局部敏感哈希算法与分布式系统相结合,建立图像索引和分布式检索平台。此外,还结合基于深度学习的图像检索技术,大大的降低了人工标注图像的主观影响,优化图像检索的最终效果。4.检索结果评价本文使用NDCG(Normalized Discounted Calculate Gain)值对检索结果进行评价,既考虑了检索结果与目标图像的相似度,同时也评估检索结果中的相似或相同图像在检索结果中的排列位置。