论文部分内容阅读
受复杂度定义模糊不清,定量表述困难的影响,图像复杂度评测方法至今没有一个统一的概念,不同研究领域给予图像复杂度不同的定义和表示方法。本文试图给出图像复杂度定义、表示和评价的方法,并通过文中提出复杂度评价策略对图像分类、图像检索和人脸识别数据集进行复杂度评价,然后对评价指标运用统计学的相关知识给出合理的解释和推论,希望能为今后的图像处理研究给出合理的参考标准。主要研究内容如下:首先,基于蒙特卡罗算法(Monte Carlo Method)和伊辛模型(Ising Model),生成了100*100和224*224的两种规格可用于图像复杂度评价的数据集,并且对生成的数据集进行了相关的统计描述和评价,验证了数据集的可用性。然后,在5组10个传统的深度学习卷积神经网络结构的基础上,调整各项参数,改进训练和测试函数,并训练、测试和保存网络模型,结果显示单个网络模型在验证集的验证输出损失非常小,几乎可以忽略不计,同一数据集在多个网络模型上的验证输出的各个统计量相差很小,频率分布函数逼近相同,借此说明了本课题可以借助于卷积神经网络模型对图像复杂度进行评测,且评价结果表现良好。接着,本文提出了CADNet网络模型,设计循环控制和注意力机制的DenseNet网络模型(DenseNet Network Model of Cyclic Control and Attention Mechanism),深层结构的网络模型增大信息流有助于改善网络训练的难度,DenseNet网络模型结构虽然已经在这方面做了努力,但是信息流量的密集程度还是没有最大化,CADNet模型结构除了DenseNet原有的流量外,在增加了注意力机制的基础上,又使每一层向前面所有层的增加特征输出,使得每一层得到的输入特征数量是DenseNet的2倍,在验证集上的实验结果表明,在少量的训练强度下,能够得到较之前网络更好的效果。最后,使用CADNet网络对图像分类、图像检索和人脸识别数据集进行了复杂度评测,对评测结果在数据的集中趋势、离散程度和分布形态多个方面做出了统计描述,最后得出客观的结论。实验结果表明,一方面,在分布形状上所有数据集在偏态特征上都呈现负偏态,在数据分布的峰态特征上均呈现高尖、胖尾形态,组内集中趋势比较明显;另一方面,图像检测数据组间离散程度最大,图像分类数据集次之,人脸识别数据集表现基本一致。