3D-AVS预测技术与特征图压缩技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yuxjmail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,3D视频成为人们日常生活中不可或缺的一部分。AVS工作组(数字音视频编解码技术标准工作组)于2014年完成3D-AVS2标准。3D-AVS2视频编码标准采用纹理图加深度图的编码方式。各视点的纹理图和深度图的编码采用AVS2编码方式,加上视间预测技术和对深度图编码的改进,形成了3D-AVS2的编码方式。本文就当前的视频标准3D-AVS2做了两部分研究。第一部分针对国内3D-AVS工作组的要求,对视间运动信息存储单元的内存问题提出了两种优化方案,第一种优化方案将预测单元改为运动信息存储单元,将后向(第二)参考帧与后向(第二)运动矢量均改为8比特存储,与RFD11.1相比在LDP与RA下合成视点分别有0.66%与2.69%的增益。第二种优化方案将预测单元改为运动信息存储单元,并将后向(第二)参考帧保存下来,后向(第二)运动矢量根据前向(第一)运动矢量、前向(第一)参考帧与当前帧标号的距离、后向(第二)参考帧与当前帧编号的距离进行确定,与RFD11.1相比在LDP与RA下分别有0.66%与0.88%的增益;第二部分针对3DAVS2的深度图提出了一个快速编码的方法:——深度图快速CU划分算法,该算法首先计算一个CU的灰度直方图,然后计算灰度直方图的灰度值分布的区间长度,若小于阈值ThL则不进行下一步的划分,否则继续划分当前CU,该方法与RFD11.0相比,合成视点在LDP配置下有0.04%的性能损失,节约了10.77%的编码时间;在RA配置下有0.10%的性能损失,节约了15.99%的编码时间。Facebook于2017年发布了根据特征快速检索相似多媒体文件的算法库Faiss。利用Faiss进行图像检索首先要提取特征。卷积神经网络提取的特征能够有效挖掘图像信息。然而高清图像特征图非常大,为图像特征检索带来了很大的计算量。本文采用VGG网络提取图像全连接层之前的特征图,利用VLAD算法将特征图进行重构,然后将特征量化和编码,再将解压后的特征矢量输入Faiss,得出量化倍率与精确度呈现反相关关系,在量化损失不大的情况下,检索精确率下降范围可以忍受。总体上,本文提出的3D-AVS2视间运动参数继承技术修改方案与现编码标准相比有一定性能增益;深度图快速CU算法在性能损失不大的情况下,节省了编码时间。关于特征图压缩的研究表明量化损失不大的情况下,检索精确率较高。
其他文献
资产管理是保险企业运营过程中较为重要的业务流程,传统的资产管理方法在采购时一般依赖于仓库管理人员的主观判断,存在正确率不高及客观性不足等问题。同时旧有的C/S架构在
旧世界的鼻叶蝙蝠(Hipposideridae)是一个蝙蝠族,使用复杂的挡板形状的鼻叶去衍射他们鼻叶向外发出的波包。蝙蝠可以改变它们鼻叶的形状通过肌肉的运动。在相近的马蹄形蝙蝠
双语实体在跨语言信息检索、机器翻译等领域有着非常重要的应用。由于缅甸语为资源稀缺语言,汉-缅双语语料库构建面临着很多困难。本文研究缅甸语语言特点、汉-缅双语可比语
太阳活动与日常生活息息相关,尤其是生活中的各种电子设备更容易受到太阳活动的影响。为了减小损失需要对太阳活动进行实时观测,及时发出预警。但是由于大气湍流的干扰,通过
由于动态随机存取存储器(Dynamic Random Access Memory,DRAM)的可扩展性变得越来越差,逐渐接近极限,其已经不能满足高性能计算机主存的大容量需求。相变存储器(Phase Change
近年来,党和政府优先对民族地区进行“弱势补偿”,公共教育资源更多向民族地区倾斜,各项教育民生工程也正在如火如荼地开展。伴随着各项帮扶性、倾斜性以及精准脱贫政策的大
随着信息技术的飞速发展,多处理机系统被广泛地应用在高性能计算领域。然而随着系统中处理机数目的逐步增大,系统发生故障的概率也随之增长。当系统发生故障后,迫切需要一种
随着智能化时代的到来,计算机数据管理正逐步由手工化向智能化转变,个人信息的智能管理也成为了热门的研究领域。如何高效管理日益增多的个人文档,提高工作效率,是数据分析与
在我们的日常生活场景中存在着大量的平面,而平面凭借其自身特殊的结构特征,在计算机视觉领域发挥着越来越重要的作用。自动提取出复杂场景中的各个平面,在图像配准、相机标
计算机公共课教学模式改革已经在我国各大高校全面铺开。以提升教学学习质量为目的,各院校逐步改进自身相关教学体系,力求获取更高的教学质量。昌吉学院积极响应这一趋势,分