基于Reg ANR的图像超分辨率算法及其在视频编码中的应用研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:deyiyushiyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,图像和视频这种能直观生动地表达信息的信息载体分布在了互联网中的每一个角落。人们对于高分辨率图片和视频的需求随着显示终端的发展越来越强烈,但由于过去采集的图像或视频分辨率较低,或是由于带宽以及存储资源受限,导致了图片、视频的分辨率不足,无法满足人们的需求,这些情况都需要采用某种技术来提高图片和视频的分辨率。超分辨率图像重建(Super Resolution Image Re-construction,SRIR)是一种能够通过软件算法,将已有的低分辨率(Low Resolution,LR)图像转换成高分辨率(High Resolution,HR)图像的技术。相比于通过硬件获取高分辨率图像,基于软件的算法具有成本低、操作简单且方式多样等特点。因此,研究图像超分辨率重建及其在视频编码中的应用具有较好的理论和实际应用价值。针对此问题,本文在图像超分辨率算法研究的基础上,提出一种基于正则化锚定邻域回归的改进超分辨率算法,并将其集成到现有的HEVC编码框架中,实现一种基于该超分辨率算法的视频压缩编码框架。具体来说,本文的主要工作及创新点如下:(1)提出基于正则化锚定邻域回归的超分辨率算法。基于稀疏表示的超分辨率算法需要在重建过程中计算稀疏系数,从而导致重建速度过慢,锚定邻域回归算法虽通过邻域映射的方式达到快速重建的效果,但这种基于稀疏字典的超分辨率算法通常缺乏对字典训练阶段的优化,从而影响算法的重建效果。为此,本文提出了基于正则化锚定邻域回归的超分辨率算法,简称Reg ANR。在字典训练阶段,算法通过对更新字典原子的误差项增加正则化约束,使字典原子在训练时快速收敛,提高稀疏字典的性能,进而达到良好的重建结果。实验结果显示,相比于其他主流的基于稀疏字典的超分辨率算法,Reg ANR算法在图像重建阶段得到的图像质量更佳,算法在图像重建速度方面也十分具有竞争力。(2)在以上工作的基础上,提出了一种基于超分辨率的视频压缩算法。主流的视频压缩编码标准都是利用视频数据在时间和空间上的冗余特性对视频进行编码,而忽视了视频中存在的大量先验信息。在带宽或存储受限的情况下,需要对视频进一步压缩,而基于学习的超分辨率算法可以充分学习视频中的先验信息,因而可将原始视频下采样以降低码率。为此,本文创新性地提出了基于超分辨率的视频压缩算法。算法将下采样后的视频进行编码传输,在解码端对解码后的视频进行超分辨率重构,进一步大大压缩了视频。对比试验表明,下采样后的低分辨率视频经过HEVC编解码,Reg ANR算法的超分辨率重建效果远超Bicubic算法;在保持相同码率的情况下,本算法的重建效果优于直接HEVC编码。
其他文献
作为改革开放最先进的城市—深圳,经过40年的快速发展,当年的小渔村已成为中国最大的城市之一。因改革开放初期粗犷式发展,之前的城市规划已无法满足现代城市的发展需求,原广
目前主流的3D立体显示技术采用基于双视点图像的的平面立体呈现手段,左右视图中引入的水平视差带来了观看者对于场景深度的体验。然而,随之出现的3D内容观看者的视觉疲劳与舒
区间概念格是最近几年给出概念格结构,它是定义在一个给定的参数区间上的,能巧妙体现确定及不确定性信息的格结构,这种格结构为不确定规则提取的研究奠定了新的基础。以此为
俄罗斯企业收入70%来源于传统产品与服务,20%来源于对传统产品与服务的改善,仅有10%来源于技术创新。虽然近年来随着科技发展,这种情况有所改善,可技术创新带来的收益占比仍
聚类是一种无监督学习方法,能够在没有任何经验信息的条件下发现数据真实分布,这一特性,使得聚类分析备受关注。谱聚类基于图论将聚类问题转化为无向图的图划分问题,相较于传
目前,以智能终端和移动网络为依托的第三代支付风起云涌,面对快速发展的第三方支付业务,以第三方支付为主营业务的相关企业,要有一套科学的、符合企业自身实际情况的绩效考核体系,从而优化企业的人力资源管理体系,调动企业内部员工的积极性,进一步为企业创造更多的价值,最终推动企业的健康、平稳发展。本文以LKL新疆分公司作为研究对象,通过对该公司的组织结构,人员分布以及员工工作状况进行分析评估,找出了目前该公司
随着工业自动化的发展,化工生产过程对故障检测技术的要求越来越高。面对石油钻井过程这类复杂化工过程,传统的故障检测方法存在检测效率低,实时性能差和对噪声的鲁棒性较弱
行人重识别在安防领域有重要的应用,而跨模态行人重识别可以在异质数据中匹配相同身份的行人,可以解决全天候监控的问题。相比于手工设计的特征匹配方法,基于深度学习的跨模
近年来,随着现代医学图像技术的快速发展,医学图像的准确分割对于医生诊断和分析病因非常重要。磁共振(Magnetic Resonance,MR)成像是利用磁共振现象,将电磁波信号经计算机处
关系分类在自然语言处理中是一个关键性热点问题,其对于问答系统、推荐系统和情感分类任务的构建都有非常重要的意义。如果能够有效地挖掘出文本中实体之间的关系信息,这对于