论文部分内容阅读
随着人工智能和机器学习的不断发展,深度学习算法在计算机视觉领域取得了突破性进展。以卷积神经网络为基础的少样本学习模型由于能够解决实际应用中的数据匮乏问题而成为研究热点。少样本学习的目的是从少量或单个样本中快速进行样本类别信息的学习,并根据学习结果对新样本进行分类。本文以少样本图像分类为研究对象,针对不同复杂度的数据集,分别给出相应的基于度量学习的少样本图像分类方法。复杂度低的少样本数据集:针对其特征提取简单、样本特征相似等特点,在原型网络的基础上,提出基于曼哈顿距离的少样本图像分类模型MPro-Net。方法:(1)MPro-Net模型在原型网络基础上添加MLP优化模块,为映射到更高维空间的嵌入向量分配权重,使得样本的嵌入向量更具鲁棒性。(2)使用曼哈顿距离度量目标集中样本嵌入向量和各类原型之间的距离,并基于距离远近对样本类别进行预测。(3)在交叉熵损失函数的基础上添加中心损失函数,通过反向传播更新网络参数,减少样本类内距离,使得嵌入向量能够更好地围绕该类原型进行分布。(4)选取部分少数民族常用手写字符,基于双线性插值算法自主构建少数民族手写字符数据集。实验:MPro-Net分别在Omniglot和少数民族手写字符两个数据集中进行实验,并和其它模型进行对比。结论:实验结果表明,MPro-Net在复杂度较低的少样本图像分类任务中具有更高的准确率和更好的收敛性能。复杂度高的少样本数据集:针对其目标特征提取困难、特征差异性大的特点,对MPro-Net进行改进,以提高模型在复杂图像分类任务中的准确率。方法:(1)加深嵌入网络深度,添加残差学习单元和恒等映射,使得嵌入网络能够获取更高层次、更加丰富的图像语义特征。(2)在嵌入模块之前添加基于FCM算法的图像预处理模块,减少和样本分类无关的特征,压缩样本类内特征,使得改进后的模型在经过预处理的图像样本上获取和分类更相关的部分重要特征。(3)使用交叉熵损失函数和调节项组成的混合损失函数,增大样本的类间距离,缩小样本的类内距离,通过梯度下降反向更新网络参数。实验:在MiniImageNet数据集上进行实验验证。结论:实验结果表明改进后的模型在复杂度高的小样本图像分类任务中具有更好的泛化性能和更高的准确率。最后,本文基于MPro-Net模型对不同分类任务的实验数据进行综合分析,给出不同分类任务对少样本图像分类结果的影响,为研究如何减少分类任务难度对少样本图像分类影响奠定了基础。基于改进MPro-Net模型针对不同复杂度数据集和不同度量方法进行实验,分析不同复杂度数据集和度量方法对少样本图像分类结果的影响,为进一步深入研究不同复杂度数据集的度量学习方法提供了思路。