论文部分内容阅读
ITU-T和ISO/IEC于2013年1月发布了一项新的视频压缩标准—HEVC。HEVC是继H.264之后的新一代视频压缩标准,与H.264相比,HEVC的压缩效率高出一倍,HEVC标准的出现解决了视频分辨率更高、视频数据量更大、存储和传输变得更加困难等难题。DCT变换在图像视频压缩领域的应用非常广泛,作为视频图像压缩的必要环节,DCT算法是图像视频编码算法中最活跃的研究部分之一。HEVC标准中的DCT变换是非常重要的预压缩过程,由于HEVC标准中需要对视频序列预测多个方向,然后通过压缩反馈获得最佳预测方向,因此需要多次执行DCT部分,所以DCT的高效实现显得十分重要。另外,HEVC对于整幅图像有更为灵活的分块机制,其中大尺寸的分块也会为相应尺寸的DCT变换带来不便,因此对大尺寸DCT变换的硬件实现研究显得尤为迫切。本文主要介绍了HEVC视频压缩编码流程中的DCT变换过程,并针对HEVC中DCT的大尺寸计算这一点,完成了两种DCT硬件架构的设计及HLS(High-level Synthesis)实现。本文的主要工作成果有:提出了以下两种硬件架构(1)基于矩阵相乘的DCT硬件架构及实现。根据资源利用率、处理延迟以及数据吞吐率这三个指标由HLS方法进行综合实现和优化,使得综合结果达到了5.56Gsps的数据吞吐率,满足了4K视频实时传输吞吐率。(2)基于蝶形算法的DCT硬件架构及实现。根据蝶形算法的运算原理,本文采用HLS方法对其进行了设计实现,与已有论文中DCT硬件结构实现结果进行了比较和分析。并以处理延迟以及数据吞吐率作为优化目标进行HLS优化设计,所完成的实现综合结果获得了6.77Gsps的数据吞吐率,比已有文献的实现结果相比获得了更高的数据吞吐率,且该实现可以应用于8K视频实时压缩。本文重点研究了HEVC中的整数DCT变换算法架构设计、HLS实现及其关键技术。在设计过程中解决了资源利用率过高、处理延迟过大和数据吞吐率无法达到目标值等问题;同时采用HLS方法完成了硬件实现,解决了传统硬件开发周期过长的问题,并且能够在一个软件设计上不断迭代出新的应用在不同场景中的硬件架构。最后对上述HLS实现分别完成了RTL功能仿真测试。其中,本文提出的硬件架构和HLS实现方法可广用于4K或8K分辨率视频的实时压缩。