论文部分内容阅读
近年来,3D视频成为人们日常生活中不可或缺的一部分。AVS工作组(数字音视频编解码技术标准工作组)于2014年完成3D-AVS2标准。3D-AVS2视频编码标准采用纹理图加深度图的编码方式。各视点的纹理图和深度图的编码采用AVS2编码方式,加上视间预测技术和对深度图编码的改进,形成了3D-AVS2的编码方式。本文就当前的视频标准3D-AVS2做了两部分研究。第一部分针对国内3D-AVS工作组的要求,对视间运动信息存储单元的内存问题提出了两种优化方案,第一种优化方案将预测单元改为运动信息存储单元,将后向(第二)参考帧与后向(第二)运动矢量均改为8比特存储,与RFD11.1相比在LDP与RA下合成视点分别有0.66%与2.69%的增益。第二种优化方案将预测单元改为运动信息存储单元,并将后向(第二)参考帧保存下来,后向(第二)运动矢量根据前向(第一)运动矢量、前向(第一)参考帧与当前帧标号的距离、后向(第二)参考帧与当前帧编号的距离进行确定,与RFD11.1相比在LDP与RA下分别有0.66%与0.88%的增益;第二部分针对3DAVS2的深度图提出了一个快速编码的方法:——深度图快速CU划分算法,该算法首先计算一个CU的灰度直方图,然后计算灰度直方图的灰度值分布的区间长度,若小于阈值ThL则不进行下一步的划分,否则继续划分当前CU,该方法与RFD11.0相比,合成视点在LDP配置下有0.04%的性能损失,节约了10.77%的编码时间;在RA配置下有0.10%的性能损失,节约了15.99%的编码时间。Facebook于2017年发布了根据特征快速检索相似多媒体文件的算法库Faiss。利用Faiss进行图像检索首先要提取特征。卷积神经网络提取的特征能够有效挖掘图像信息。然而高清图像特征图非常大,为图像特征检索带来了很大的计算量。本文采用VGG网络提取图像全连接层之前的特征图,利用VLAD算法将特征图进行重构,然后将特征量化和编码,再将解压后的特征矢量输入Faiss,得出量化倍率与精确度呈现反相关关系,在量化损失不大的情况下,检索精确率下降范围可以忍受。总体上,本文提出的3D-AVS2视间运动参数继承技术修改方案与现编码标准相比有一定性能增益;深度图快速CU算法在性能损失不大的情况下,节省了编码时间。关于特征图压缩的研究表明量化损失不大的情况下,检索精确率较高。