论文部分内容阅读
近年来,随着卷积神经网络的不断发展,其在高级计算机视觉的诸多领域内有着广泛的应用。在图像分割领域,其模拟人脑对于图像的处理,相比其他传统方法对分割结果有着显著的提升。全卷积网络的提出使端到端的图像语义分割网络成为可能,同时也使深度学习算法成为了图像语义分割的主流。然而,在像素级别的图像语义分割中,由于卷积层本身特性的限制,语义分割的结果仍然是相对粗糙的。针对这个问题,概率图模型与卷积神经网络相结合能有效提升在图像分割细节方面的表现。在近期的很多相关工作中,使用到能量势函数最多为二阶的条件随机场对卷积神经网络模型输出做直接优化。针对二阶条件随机场对卷积神经网络分割优化的局限性,我们提出了使用基于团的更高阶条件随机场来优化分割结果,团的生成将采用已有的分割方法以及超像素生成方法。通过将条件随机场作为网络尾端的一层嵌入卷积神经网络,我们实现了对卷积神经网络和条件随机场进行联合训练,这比二者分开训练要高效得多。基于PASCAL VOC2012数据集,我们通过多组实验证明了与原始的方法相比,我们的基于高阶条件随机场的图像语义分割系统的准确率有了一定程度的提高。针对基于静止图片的人群计数,由于在人群密度图中,区域分割这类较大分割块在条件随机场中的高阶势能对优化几乎无贡献且增加计算复杂度。我们在著名的多列卷积神经网络尾端加入了基于小块密度图的四连接二阶条件随机场模型,以对结果图中出现的较大噪点进行平滑优化。在基于多列卷积神经网络构建我们的优化模型的过程中,我们采用了类似反卷积神经网络(DNN)的思想对原卷积神经网络的输出密度图进行插值放大,来保证与输入图像的尺寸相同,并生成尺度固定的小块密度图,从而输入到条件随机场进行训练和推理。与原始的方法相比,人群计数的准确率有了显著的提高。