论文部分内容阅读
互联网快速发展的今天,图像信号数据量的激增给存储空间带来了巨大的挑战,研究更加高效的图像编码技术势在必行。近年来,基于字典训练的图像稀疏表示方法在图像编码领域取得了较好的进展。该方法根据图像自身特征选择合适的字典实现图像编码,改善了传统编码算法自适应差、灵活性低的缺点。但线性局限性、超参数确定以及稀疏度与最优解的相互限制是当前字典训练算法存在的主要问题,这些问题增加了图像稀疏表示技术的运算复杂度。本文的创新点有:1.研究基于自组织映射(Self-Organization Map,SOM)算法的模式字典构造,实现基于图像稀疏表示的图像编码。2.利用两种聚类算法构造初始模式字典。3.对SOM算法中的学习函数、邻域函数、失真测度标准等关键步骤进行改进。4.研究基于模式字典的信噪比(Signal Noise Ratio,SNR)可分级编码方案,实现基于模式字典的SNR可分级视频图像编码。本文的具体研究内容与工作主要包括:1.介绍图像稀疏表示的基本原理,对现有字典训练算法进行讨论,分析其优缺点。2.针对现有字典训练算法在实现图像编码时受到的线性约束限制,本文研究一种基于SOM的单目标非线性稀疏表示模型。3.通过分析影响模式字典性能的主要问题,对模式字典初始化算法及SOM算法关键步骤进行改进:(1)首先研究基于聚类的模式字典初始化算法,利用K-mediods算法以及频率模糊聚类算法(Frequency Fuzzy C-Means,F-FCM)对图像预处理,根据模式权重构造类别明显的初始化模式字典,削弱具有相似特征的模式相距较远的弊端;(2)其次改进传统SOM算法的学习函数以提高模式学习效率,并利用Manhattan距离权函数作为新的邻域函数,拓宽邻域搜索路径;(3)最后引入sigmoid核作为新的失真测度衡量标准,提高模式匹配精度。实验结果显示,基于改进后的SOM算法构造的模式字典能够较好的实现图像重建。4.研究基于模式字典的SNR可分级编码方案,选择静止图像与视频图像验证编码方案可行性。仿真实验表明,基于SOM算法构造的模式字典能够较稳定地对视频图像实现可分级编码。