SIMD指令自动向量化编译框架

来源 :2005中国计算机大会 | 被引量 : 0次 | 上传用户:canghaiyuemenglong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了支持多媒体及数字信号处理应用,许多通用及嵌入式处理器都拥有短向量SIMD(单指令多数据)指令,可以用一条指令同时对多个数据进行操作。传统上,对 SIMD 指令的使用是通过采用内联汇编或调用库函数的形式实现的,造成程序的可移植性差;程序员需要识别程序中可向量化的部分来使用 SIMD 指令,加重了程序员的负担。Leupers 提出了一种基于数据流图的代码选择技术,支持 SIMD 指令的自动向量化。本文在对此算法进行了改进,使之能够自动向量化更多的 SIMD 指令,并讨论了与自动向量化编译相关的循环检查、循环展开、规则语义动作实现等,并给出了总的编译框架。
其他文献
商业智能主要覆盖数据访问、查询和报表工具,它还包括为了提高公司决策制定速度和深度的分析工具,如 OLAP、数据挖掘等。本文探讨了商业智能中的报表工具、开放源代码等相关技
在中国长期的封建社会里和半殖民地半封建的社会里,农民遭受了地主阶级残酷的经济剥削和政治压迫,过着贫穷困苦、没有人身自由的悲惨生活,这也迫使农民不断地进行了反抗斗争.
本文概括了程序切片技术发展现状,在分析了面向对象程序切片存在的问题的基础上,扩展了切片粗粒度的含义,把粒度增大到单元级,引入并分析了波动效应,并针对波动效应的计算给出了数
对可分解概率模式, 在 0-1 损失下证明了无向马尔科夫毯分类器是最优分类器. 针对目前建立无向马尔科夫毯结构效率和可靠性低的问题, 本文基于贝叶斯网络理论、马尔科夫网络
会议
发现频繁项目集是挖掘关联规则过程中的关键问题。本文给出的 IODLG 算法是一种基于关联图的频繁项目集挖掘算法,通过引入节点的出度值和入度值信息,可以减少 k-项目集的数量及
海南海洋气候条件优越,热带物种资源丰富,区域优势明显,是我国重要的反季节瓜菜、热带作物、热带水果和热带水产品生产基地。近年来,海南省大力实施具有热 Hainan enjoys su
本文研究了 P2P 网络在流媒体领域的应用,介绍了一种基于 P2P Overlay 的实时流媒体系统的设计。该系统基于非结构化Overlay,利用基于 gossip的散播协议发送消息;一个轻量级的启
中间件技术已经成为应用系统的支撑。作为面向消息的中间件(MOM)的一部分,消息代理中间件可以屏蔽不同的硬件平台、数据库、消息格式、通信协议之间的鸿沟与差异,可以提供应用到
会议
从宏观和微观两个不同的视角对面向对象需求分析的方法进行了分类,并分别对这两类方法进行了探讨。在微观方法中结合 UML 对“注册讨论班系统”进行了实例分析。面向对象需求
EStar-SM是自主开发的32位嵌入式流媒体微处理器。本文论述了在保持兼容性和通用性的前提下,针对流媒体处理的小位宽高并行的特点,设计了增强的64位流媒体处理指令体系结构,并通