基于近邻传播聚类的Context模型量化算法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:dephibase
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机硬件性能的提升和算术编码的广泛应用,基于高阶Context模型算术编码得以在熵编码系统中实现。一般概念上认为,为了有效统计信源复杂的高阶相关性,使用高阶Context模型便可以更好的反映当前所要编码符号的概率,但事实证明即使用足够多的样本来训练,高阶Context模型也很难在统计中有效收敛于信源的真实分布,编码压缩效果反而会降低,这就是基于Context模型无损压缩编码遇到被称为"Context稀释”或“模型代价”的问题,此外高阶Context模型无论在训练还是编码中都需要如几何级数增加的计算量和存储空间。为了解决“模型代价”和计算量、存储量过高的问题,一种有效的方法是对Context模型进行量化。Context模型量化是对经过一定训练而建立的Context条件分布模型进行合并得到简化的并且量化误差较小的Context量化模型,使用量化后的模型进行熵编码不仅能够实现,还能解决“模型代价”问题,得到理想的编码效果。有研究者证明在选择了合适的失真量度后,Context模型量化问题等同于普通的矢量量化问题,使用聚类算法便得到最优Context量化模型。这又将面临两个问题,给定聚类数时结果是否全局最优,聚类数为多少时结果为最优。为了解决这两个问题,我们在众多聚类算法中选择了新近提出的一种称为基于近邻传播聚类的算法作为研究对象,通过对该聚类算法原理的学习,针对Context模型量化的特点,提出基于近邻传播聚类的Context模型量化算法。实验证明基于近邻传播聚类的Context模型量化算法比基于矢量量化的Context模型量化算法在熵编码中的编码效率更优,基于近邻传播聚类的Context模型量化算法计算时空复杂度较小且能找到相对最优的Context模型条件分布的量化聚类数,能够较好地解决“模型代价”问题。
其他文献
卡介菌多糖核酸(BCG polysaccharide nucleic acid,BCG-PSN)是我国首创的新型治疗和免疫调节剂。主要用于预防和治疗慢性气管炎、感冒和哮喘等疾病。可特异增强呼吸系统器官
2003-2004年,分别从雅砻江水系和岷江水系采集了齐口裂腹鱼,从长江上游合江江段采集岩原鲤,采用扩增片段长度多态性DNA(AFLP)和线粒体控制区(D-loop)序列变异分析,对这两种鱼的遗
目的:初步探讨E2F1蛋白和Sedlin蛋白在体内体外有无相互作用,进而为迟发性脊柱骨骺发育不良(SEDT)的靶向治疗提供新的思路。  方法:以含人E2F1全长cDNA序列的质粒为模板,用常规