面向超高清视频的感知编码技术

来源 :宁波大学 | 被引量 : 0次 | 上传用户：magicwen_STWH

【摘要】

：

【作者】

：

崔鑫

【机构】

：

宁波大学

【出处】

：

宁波大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

超高清（Ultra-high definition,UHD）视频具有高分辨率、高帧率、广视角和宽色域等特征,能够为用户提供高质量的视觉体验,成为目前多媒体技术发展的主要方向之一。但是随着UHD视频业务的迫切需求和推广应用,UHD视频的传输和存储都面临着巨大的挑战。目前,UHD视频编码技术发展迅速,编码压缩效率进一步提高,但编码复杂度也大幅增加。基于UHD视频的低复杂度编码以及感知编码技术成为目前研究的热点。本文就此展开以下四个方面的研究:（1）提出了一种联合多特征的未来视频编码（Future video coding,FVC）快速算法。算法联合FVC编码过程的多个感知编码特征的后验概率信息,估计当前编码单元的划分方式,通过提前终止若干编码单元的划分来节省编码时间。此外,针对单个特征贝叶斯分类不准确的问题,本文结合多个特征的后验概率信息。实验结果表明,在随机接入（Random access,RA）配置、低延迟P帧配置和低延迟B帧配置下,本文提出的算法在保证视频主观质量的前提下,平均减少35.7%、25.6%和26.7%的编码复杂度,而BDBR只仅仅增加了4.3%、3.1%和2.89%。（2）提出了一种基于信息熵滤波的恰可察觉失真（Just noticeable distortion,JND）感知视频编码（Perceptual video coding,PVC）方案。首先,通过主观实验,建立了基于10比特位深UHD视频图像的变换域亮度掩蔽效应模型。同时针对UHD视频图像的广角度带来的观看视角不固定的特点,设计了基于变换域的显著性权重因子。其次,考虑到不同图像纹理区域中JND阈值的差异性,设计了高斯微分熵滤波器,用于控制不同纹理区域中JND阈值的强度。最后,将本文提出的JND模型嵌入到高效视频编码（High efficence video coding,HEVC）的变换/量化编码过程中,利用JND阈值抑制变换系数来降低编码码率。为了更有效地实现JND抑制作用,在率失真优化（Rate distortion optimization,RDO）过程中引入失真补偿因子和失真补偿控制因子来控制失真程度。实验结果表明,所提出的PVC方案在视频主观质量损失可以忽略的情况下,在低延迟（Low delay,LD）配置下平均节省了32.98%的码率,RA配置下平均节省了28.61%的码率。与HEVC编码平台相比,在LD和RA配置下的平均编码时间分别增加了12.94%和22.45%。另外,与其他PVC方案相比,所提出的PVC方案主客观质量更高,码率节省更多,同时编码复杂度更低。（3）提出了一种基于感知噪声信道模型的PVC方案。首先建立了视觉抖动模型,用于模拟外部环境改变引起的视觉抖动,并将视觉抖动的刺激信号作为边信息进行传输,在此基础上建立了感知噪声信道模型。然后,利用因子图模型提出了基于消息传递算法的视觉抖动量化步长估计算法。在保证可靠传输和不可感知特性的前提下,得到视觉抖动量化步长。同时,利用该量化步长,计算视觉抖动及其噪声。最后,在编码的RDO过程中引入感知噪声权重因子,并设计了基于HEVC的PVC方案。同时,为了更有效地控制不同编码量化参数下的不同失真补偿程度,在RDO过程中引入了失真补偿控制因子。实验结果表明,所提出的PVC方案在LD和RA配置下分别节省码率为35.93%和24.93%,并保证了视频的主观质量。与原始编码平台相比,在LD和RA配置下,平均编码时间分别增加了13.53%和19.26%。与其他PVC方案相比,提出的PVC方案可以获得更高的主客观视频质量,节省更多的码率,同时具有更低的编码复杂度。（4）提出了一种基于感知噪声贝叶斯网络（Perceptual noise bayesian network,PNBN）的自适应JND模型的PVC方案。首先,根据主观实验提出了基于10比特位深UHD图像的像素域亮度掩蔽效应模型。同时利用主观实验,改进了非线性可加掩蔽模型（Nonlinear additivity model for masking,NAMM）的参数,使模型适用于10比特位深UHD图像。然后,基于PNBN动态地估计满足基于图像混乱度的视觉抖动量化步长范围内和边信息译码准确率条件的视觉抖动量化步长。利用该量化步长计算视觉抖动及其噪声,并建立了基于视觉抖动噪声的JND模型。该JND模型同时考虑了亮度掩蔽和纹理掩蔽效应,可以根据图像中的不同纹理区域,自适地调整纹理掩蔽效应强度。最后,将改进的NAMM模型和基于PNBN的自适应JND模型分别嵌入多功能视频编码的RDO过程中,并引入感知噪声权重因子和失真补偿因子。实验结果表明,在全帧内配置下,基于PNBN的自适应JND模型和基于NAMM模型的PVC方案分别节省码率25.17%和12.79%,同时两种PVC方案都保证了编码后视频的主观质量。由于基于NAMM模型的PVC方案采用了对像素域残差编码单元的抑制预处理,与原始编码平台相比,平均编码复杂度降低了33.28%,而基于PNBN的自适应JND模型的PVC方案编码复杂度增加了19.38%。另外,与其他PVC方案相比,基于PNBN的自适应JND模型的PVC方案可以获得更高的主客观视频质量,节省更多的码率,同时具有更低的编码复杂度。

其他文献

四川贡嘎山地区的雪豹分布及其与同域动物和放牧活动的关系研究

大型食肉动物对生态系统结构和功能的维持起着重要作用,但由人类活动的干扰,过去两个世纪大型食肉动物种群及其分布出现急剧萎缩,一些物种甚至濒临灭绝。目前全球很多地方已采取措施保护大型食肉动物,但它们依旧面临着诸多人类活动的胁迫,特别随着全球人口数量的不断上升,人们对肉类及畜牧业需求的增长可能会促使放牧成为保护大型食肉动物工作中面临的重要挑战和最紧迫的问题之一,牧区大型食肉动物分布萎缩的可能性也因此更加

学位

中国电影产业网络的双维度联系特征及其影响效应研究

20世纪80年代以来,产业发展日益依赖于多个企业间基于产业内分工协作形成的产业网络。这种产业分工模式的组织运营对于提升企业经济绩效、维系区域产业竞争力具有重要的意义。具体而言,产业网络在地理空间上体现为以下两个维度:一是由于集聚力量形成的地方产业网络,另一个是由于扩散力量形成的跨区域产业网络。在此背景下,地方产业网络联系与跨区域产业网络联系对产业发展的影响在学术界引起了广泛的讨论:部分学者关注产业

学位

民法视角的职业资格证书制度研究

我国的职业资格证书制度通常被人们视为在市场经济体制下,利用行政许可的方式来实现劳动力资源评价调配的重要管理手段。由于对公民的职业资格身份权利和个体利益在建立人力市场机制建设方面所起的重要作用,还明显认识不足。尽管该制度的改革已经进行多年,绝大多数学者仍然是从政府主导的经济干预、行政管理或职业培训等视角对该制度进行研究。究其原因,缺乏从民法视角对该制度进行研究,没有职业资格身份权基本理论和职业资格证

学位

对外汉语写作话题库建设与话题词表构建

从一个民族语言系统的角度,“词汇”是民族承载语言信息的基本载体,也是语言系统中最活跃的部分。在语言系统中,社会生活的变化总能最快最明显地反映到词汇上来,因此,语音、词汇、语法三要素中以词汇的变化范畴最大、变化速度最快。在对外汉语教学中,“词汇”一直是教学的重点和难点。“词汇”之于语言的重要性无不彰显着“词汇”之于语言习得的重要性,而该“教什么”才能让学生“学以致用”,则需要研究者基于对词汇的定性分

学位

新型材料在饮料中邻苯二甲酸酯和血清中维生素D、E分析中的应用研究

研究背景:随着材料科学、纳米科学和绿色化学等学科的迅速发展,大量的新型材料不断涌现,并被应用于分析化学领域的研究。在复杂基质样品中痕量待测物分析方法的建立中,对复杂样品进行更有效的样品前处理,仍是一项极具挑战性的工作。利用新型材料与待测物之间各种相互作用,选择理化性质合适或对待测物特异性识别的材料作为萃取相,可提高前处理方法的特异性和选择性;选择低毒的绿色溶剂代替传统样品制备中大量使用的有机溶剂,

学位

零训练运动想象脑机接口

脑机接口提供了一种可以绕开神经系统和肌肉组织,直接与外界进行联系的通道,在医疗,通信,控制,娱乐等方面具有非常广阔的应用前景。然而,由于脑电信号具有非平稳特性,用户使用前,需要进行大量的训练,这大大限制了脑机接口的应用。本文的主要工作是以运动想象脑电数据作为研究对象,在特征提取,特征融合和分类器设计三个层面,分析用户之间的共性和差异,研究利用用户数据样本之间的共性,减小用户数据之间差异,结合迁移学

学位

磁控溅射共沉积Ag-Mo合金薄膜组织结构与性能研究

银和钼属于稀贵金属,在平衡条件下是难混溶的,人们常采用粉末冶金方法将其制备成“假合金”,用作减摩耐磨与电接触材料等。为了节约资源、降低成本,推进银钼合金薄膜涂层化应用具有重要意义。研究表明,多数典型难混溶体系经非平衡技术制备的合金薄膜会形成与平衡态“假合金”不同的亚稳态固溶体,目前银钼合金薄膜研究报道还不多,有必要深入系统研究银钼合金薄膜的组织结构和性能,以开发和拓展其应用范围。采用双靶磁控溅射共

学位

严酷环境下混凝土内膨胀力空间分布与演化理论

混凝土在硫酸盐侵蚀作用下,侵蚀产物在混凝土内部形成挤压应力或使水泥产物脱钙都将引起混凝土性能劣化,尤其是在严酷硫酸盐侵蚀环境下,将严重威胁混凝土结构使用安全及结构的耐久性。本文将分别研究膨胀挤压应力演化模型揭示混凝土在复杂硫酸盐侵蚀环境下的劣化机理及混凝土水化产物脱钙对混凝土劣化的影响。首先,通过试验方法研究了混凝土在恶劣硫酸盐侵蚀条件下及水化产物脱钙条件下宏-微观力学性能劣化,宏观性能主要包括材

学位

高强度航空钛合金TC21切削力学特征及实验研究

钛合金材料性能优异,已广泛应用于航空航天、国防军工、生物医学及海洋等众多工业领域。然而,大多数钛合金材料都是难加工材料,钛合金材料在加工过程中存在温度高,刀具磨损快,加工质量和效率难保证等缺点。因此,其切削机理和加工性的研究成为了切削技术研究的热点。钛合金TC21作为一种高强、高韧、高损失容限的新型钛合金,具有高强度、高塑性、高断裂韧性及低裂纹扩展速率等优点,其综合力学性能非常优异,主要用于航空器

学位

硅基压电薄膜声波器件厚度振动若干问题研究

压电薄膜谐振器是一种新型体声波谐振器件,利用压电薄膜的压电效应制成,谐振频率可高达GHz,其作为频率控制的核心元件,广泛应用于通讯和传感等领域。硅基压电薄膜复合结构较常应用于压电薄膜谐振器,滤波器和传感器之中,一般包含硅基底层,下电极层,压电薄膜层和上电极层。压电薄膜的c轴有不同的取向,可激发出厚度伸缩和厚度剪切两种不同的振动模态。通过电极的设计,可实现不同振动模态的激发。同时,通过电极结构的设计

学位

面向超高清视频的感知编码技术

其他学术论文