论文部分内容阅读
近年来,随着多核处理器逐渐成为市场主流,多核编程标准也愈加受到关注。目前主流的多核编程标准主要有两个:Open MP和MPI。相比于面向消息传递系统结构的多核编程标准MPI,Open MP的使用更加简单与方便,因此以Open MP为代表的面向共享存储系统结构的编程标准随着多核技术的普及与进步而迅速发展。如何能够有效利用Open MP特性,从而最大程度地挖掘程序中潜在的并行性,以及如何探索一系列针对Open MP程序的优化方法,对于未来的多核技术的发展具有十分重要的实践意义与价值。本文的研究工作主要包括以下两个方面:(1)本文以飞腾多核DSP为课题研究背景,从并行计算理论出发,研究了Open MP编程模型及其相关特性,针对Open MP程序的开发流程提出了基于Open MP的并行优化流程,总结了Open MP程序开发过程中的优化方法与策略,并在飞腾多核DSP平台上结合基准测试程序UTDSP对性能优化方法进行了测试,验证了优化方法的有效性。(2)针对开源解码程序FFmpeg的H.264解码部分进行了移植,在飞腾多核DSP平台上利用相关分析工具统计出程序中的热点区域和模块,结合Open MP特性对热点区域和模块进行了优化分析,进而设计并实现了基于Open MP的优化方案,并最终在飞腾多核DSP平台上完成了测试,从而快速而有效地提升了H.264解码程序的性能,使得程序性能获得了近20%的提升,同时也验证了Open MP并行优化所具有高效便捷的优点。