面向龙芯多核的H.264并行解码算法设计与实现

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:limajubo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在存储容量和传输带宽的限制下,视频编解码一直是多媒体应用的重要课题之一。在过去的二十多年里,各种视频编解码标准层出不穷,其中H.264标准凭借其卓越的压缩比和良好的网络亲和性逐渐成为主流标准。但H.264标准采用的各种先进编码技术导致其解码计算复杂度很高,大多数单核处理器难以满足这种要求。   挖掘程序的并行性是提高程序性能的有效途径之一,特别是针对一些计算复杂度很高、难以在单核处理器上应用的串行算法进行并行化处理,可以显著提升该类程序的性能。片上多核处理器的普遍应用使得挖掘程序的并行性成为计算机应用领域的研究热点之一。因此,挖掘H.264解码算法的并行性具有非常重要的意义。   本文结合龙芯3A多核处理器的特点,对传统串行H.264解码算法进行并行化。然后利用处理器提供的多媒体指令集,对并行解码算法进行进一步的优化,在不增加内存消耗和不影响人眼对视频体验的基础上,提高了视频的解码性能。   本文的贡献有:   1、设计并实现了一种面向龙芯3A多核处理器的H.264并行解码算法。该算法基于功能并行和功能流水思想,利用H.264解码中亮度分量和色度分量的无关性,对算法中的亮度分量解码流程和色度分量解码流程进行并行化,同时划分功能模块并实现功能流水,使得算法的最大理论加速比达到4。   2、结合龙芯3A多核处理器的多媒体指令集,对算法中占用时间最多的亮度分量运动补偿功能模块进行优化。实验结果表明,在不影响人眼对视频体验的前提下,亮度分量运动补偿功能模块的执行时间平均减少了20%,有效降低了亮度分量解码的负载,提高了整个并行解码算法的性能。
其他文献
近年来多租户技术作为一种能够有效提高资源利用率和减少系统运行成本的软件架构技术越来越多地得到广泛应用,多租户技术要求不同租户之间保持数据和应用程序的隔离。隔离是
随着互联网行业的快速发展,以及社交网络和多媒体分享网站的兴起,如何从互联网中海量的多媒体数据中快速准确的找到用户需要的信息变得异常重要。传统的基于文本的搜索技术在
在很多领域中都有带参系统的实际应用,如缓存一致性协议、安全系统和网络通信协议等。一般而言,带参系统中存在多个完全相同的并发进程,这些进程的个数即带参系统的参数。对带参
现代高能物理研究需要使用高能量的粒子加速器,加速器束流动力学模拟软件具有重要的实用意义。利用超级计算机技术的优势,开发出能够充分利用计算资源模拟各种能量和高密度的直
随着社会经济发展水平的不断提高和科学技术的不断进步,人们对安全防范技术的要求也越来越高,随之而来的是,视频监控系统的产生和广泛应用。目前,主流的视频监控系统的是基于
无线传感器网络是新兴网络,它采用无线通信技术,由微小的传感器组成。无线传感器网络节点具备感应能力、信息处理能力和无线通信能力。可广泛用于军事、环境、医疗保健、空间探
随着数字技术和互联网应用的发展,普通用户在作为数字内容的使用者之外,还同时成为了数字内容的主动生产者和传播者。在这样的背景下,用户创作和对等共享数字内容出现了显著
随着无线通信、大规模集成电路和嵌入式技术的发展,无线传感器网络迎来了高速的发展。近年来,基于无线传感器网络的研究热点主要关注路由协议、能量消耗和数据处理等方面。而
随着无线通信技术、普适计算技术以及微机电技术的飞速发展,物联网作为连接物理世界与信息空间的桥梁加速融入到我们的日常生活中。通过物联网技术,能够将真实的物理世界信息化
随着通讯和计算技术的发展,呼叫中心坐席系统被广泛运用于各行各业。由于业务的多样化需求和融合通信的发展趋势,传统的坐席系统需要提供越来越多的新功能,并与业务相关的CRM