论文部分内容阅读
随着大数据时代的到来,网络上的家具图像数量急剧增多。面对海量的家具图像数据,用人工对图像进行语义属性标注,并用这一语义特性进行检索,需要耗费大量时间和人力成本。并且由于人的主观性偏差,无论是标注者还是查询者,都不能准确一致的述图像的全部信息,这给检索带来了相应的挑战。因此寻找一个高效便捷的家具图像检索方法是一个具有实际意义的课题。近年来,通过卷积神经网络取的图像特征,不仅能够有效表示图像,而且能成功地应用于图像分类、图像检索等许多任务中,这使得专家学者对深度学习的研究越来越多。本文基于卷积神经网络对家具图像检索技术进行研究,具体完成了以下工作:1.针对自建的家具图像数据库样本重复率高,很多产品类中包含有不相关图片的问题,出了高数据库质量的去重和去不相关两个算法。利用深度卷积神经网络,提取对应图像所代表的Embedding,并在欧式空间中计算Embedding间相互距离,达到去重和去不相关目的。本文利用“时间”和“准确率”两个标准对去重和去不相关算法做性能评估。展示了部分样本类在去重前后、去不相关前后的对比实例图。对去重和去不相关后的数据库,分别测试了基于Goog Le Netplus模型检索的Recall值,证明了两种筛选算法的有效性,克服了传统筛选过程中操作复杂。2.针对家具图像数据量大、类别多等特点,改进了Goog Le Net网络模型,在其结构上增加了两个全连接层,扩充网络模型容量,并将其命名为Goog Le Netplus。为了有效构造样本对,升训练和检索效率,Goog Le Netplus模型选取Lifted Structured Feature Embedding(LSFE)为损失函数。实验分析比较了四个不同卷积神经网络模型Siamese Network、Triplet Network、基于LSFE的Goog Le Net和Goog Le Netplus在家具图像检索中的效果,证明改进后的模型Goog Le Netplus在检索能力上优于其他三个模型。此外,本文分析探究了影响家具图像检索准确率的一些因素和四个模型在训练时损失函数的收敛情况。展现了一些成功和失败的查询实例并分析了对应的原因。最后基于训练好的卷积神经网络模型参数,搭建了一个家具图像检索移动客户端原型。