论文部分内容阅读
多核设计的IBM Power 5
谈到双核处理器的起源,首先就要提到蓝色巨人IBM。IBM在1999年10月微处理器论坛中,率先披露了其双核处理器Power 4的研发计划,以0.18微米铜互连搭配绝缘硅技术打造的工程样片于2000年1月研制成功,时钟频率冲上1.3GHz,当时引爆了整个业界对双核以及多核处理器发展的关注。
辉煌的IBM处理器
IBM目前共拥有4条处理器产品线:Power体系结构、PowerPC 系列的处理器、Star 系列以及 IBM 大型机上所采用的芯片。其中PowerPC 源自于 Power 体系结构,在 1993 年首次引入。PowerPC 是 Apple、IBM 和摩托罗拉联盟的产物。随着Apple宣布启用PowerPC处理器,业界关注焦点已经转向Power体系结构。
在最近 10 年中,IBM 在半导体领域实现了一个又一个的突破:铜互连技术、绝缘硅、硅锗技术、应变硅、低k绝缘体以及空气孔绝缘布线技术(5月上旬刚刚宣布),这些新技术给它的服务器CPU发展奠定了扎实的基础。IBM的Power结构体系为广泛的处理器提供了技术基础,包括IBM的高端服务器芯片Power处理器,以及为计算机、服务器、手持设备和网络产品设计的PowerPC处理器。
传统PC处理器都采用CISC架构(复杂指令集),其效率相对较低,而IBM的Power处理器则是基于RISC架构(精简指令集)。尽管CISC架构能够有效地缩短新指令的微代码设计时间,并且提供非常好的兼容性,但是不同的指令长度相差很大,需要不同的时钟周期来完成,执行较慢的指令将影响整台机器的执行效率。
而对于基于RISC架构的Power处理器而言,其指令都是固定长度的,这种统一长度指令使得工程师能更轻易地设计处理器,让他们省掉一些不必要的装置来加速执行能力。
IBM Power处理器的特色是指令流水线,而且都是多级执行单一指令。事实上,不管是RISC或是CISC的整数、浮点还是SIMD单元,在不同架构中会有不同的层级变化。Power处理器的四级主要流水线分别是译码、分送、执行与单元使用,通常每个步骤只需花费处理器最小的周期来完成。由于考虑到每个单元需要不同的硬件,在不同的指令下平行执行不同的单元是处理器设计的逻辑步骤,所以Power处理器的流水线处理方式十分灵活。
Power 5大获成功
IBM在双核处理器Power 4上采用CMP技术,此时一个硅片上集成两个64位超标量微处理器核心,并且使用MCM(多芯片模块)封装方式,将4个Power4组合成一个较大的封装,类似一个8个CPU的SMP系统。
真正让多核技术大放异彩的还是IBM Power 5处理器。
IBM Power 5处理器芯片内建虚拟引擎,每个处理器的微分区技术允许定义10个动态逻辑分割区或“虚拟服务器”,可以模拟出不同服务器的环境。每部虚拟服务器可选择Unix AIX 5L、Linux或i5/OS操作系统。
Power 5另一项改进的特点是,将通用与浮点寄存器的数目从80组增加到120组,同时在许多执行单元,如指令预撷取缓冲区、指令执行状态保留区及地址转换表上有改进,以确保可以一分为二的单核心同步多线程的能力。
每个子CPU核心可以仿真成两个逻辑处理器来协同运作。这项类似于Intel超线程的技术使得每个处理器硅芯片电路相当于具备4颗逻辑处理器的能力,再加上Power 5处理器又包入4个处理器硅芯片,相当于当我们插入一颗Power 5处理器实体芯片之后,就可以开启16个逻辑处理器,将目前多处理器并行运算的能力大幅增加。
IBM多核CPU计划
IBM计划在即将发布的Power 6处理器上采用QCM封装技术,即将两个双核Power 6芯片封装到一起,构成四核的Power 6处理器。
IBM声称新的Power 6处理器的工作频率将达到4~5GHz之间,目前的样品已经可以运行在5.8GHz工作频率上,而这个时候处理器的内核温度将不会超过85摄氏度。
Power 6处理器将主要应用在IBM自己的刀片式服务器和P系列服务器产品线中。
不过,据称IBM刀片服务器中所使用的Power 6处理器工作频率大约只有4GHz左右,IBM称Power 6处理器将搭载新的节电技术,这可以让Power 6处理器在空闲状态下的功耗降低30%~35%。
Power 6有极高带宽可提供给处理器。在5GHz工作频率下,每个Power 6内核都具有300GB/s的带宽水平:大约80GB/s来自三级高速缓存、75GB/s来自内存、80GB/s来自MCM内部总线、50GB/s来自远程处理器、20GB/s来自本地的I/O设备。
Power 6的带宽比Power 5系统增加了一倍,这是由于频率提高以及添加了一些新接口的缘故。
Power 6还通过使用一个内存控制器和MCM内的结构线路,从而把I/O频率从CPU频率的三分之一提高到了二分之一。每个内存控制器使用IBM的第三代同步内存接口连接到内存。
根据英国The Register网站5月21日披露的信息显示,Oracle已经在一台配备了4块Power 6芯片的IBM p570服务器上成功地运行了Oracle 11i数据库,整体性能表现比上一代处理器提高了不少。
新的服务器系统在处理2100个用户时的平均响应时间为0.625秒。与之相对比,采用2.2GHz Power 5 处理器的IBM p570系统在处理2000个用户时的平均响应时间为0.983秒。由此可见,Power 6的整体运算能力比上一代有了很大地提升。
当其他芯片厂商开始放弃对于芯片时钟频率的追求,转而通过增加芯片核心来获得性能提升的时候,IBM却要在Power 6上保持对于频率和性能的“双丰收”。
IBM Power处理器路线图
链 接:MCM封装技术
采用MCM封装技术的Power 5处理器
虽然MCM(多芯片模块)技术近年来愈来愈热门,然而MCM技术的起源却相当地早,远在20世纪70年代IBM就已经提出。当时IBM在研制一种磁泡存储器(Bubble Memory)技术,磁泡存储器属于非挥发性存储器的一种,IBM开发此种存储器是打算将其运用在IBM自属的计算机设备中。该存储器使用了一种磁性材质的薄膜,运用薄膜来营造与保留小型的扇区,以此来进行储存记忆。这种小扇区就被IBM称之为“磁泡”,每个小扇区可以记忆一个位(bit)的资料。
不过这种技术在商业运用上并没有成功,原因在于20世纪80年代开始硬盘的崛起,使磁泡存储器在容量价格比上无法竞争,因而退淡,但当时的磁泡存储器就已经用上MCM概念的技术。
之后,MCM技术沉寂了相当长的一段时间。20世纪90年代,Intel在Pentium Pro上也尝试使用MCM技术,但是由于商业上的问题,随着Pentium Pro的沉寂,MCM技术也再度沉默。直到2001年,IBM发布Power 4处理器时,再次使用MCM,至此MCM终于随着Power芯片的成功而大放异彩。
谈到双核处理器的起源,首先就要提到蓝色巨人IBM。IBM在1999年10月微处理器论坛中,率先披露了其双核处理器Power 4的研发计划,以0.18微米铜互连搭配绝缘硅技术打造的工程样片于2000年1月研制成功,时钟频率冲上1.3GHz,当时引爆了整个业界对双核以及多核处理器发展的关注。
辉煌的IBM处理器
IBM目前共拥有4条处理器产品线:Power体系结构、PowerPC 系列的处理器、Star 系列以及 IBM 大型机上所采用的芯片。其中PowerPC 源自于 Power 体系结构,在 1993 年首次引入。PowerPC 是 Apple、IBM 和摩托罗拉联盟的产物。随着Apple宣布启用PowerPC处理器,业界关注焦点已经转向Power体系结构。
在最近 10 年中,IBM 在半导体领域实现了一个又一个的突破:铜互连技术、绝缘硅、硅锗技术、应变硅、低k绝缘体以及空气孔绝缘布线技术(5月上旬刚刚宣布),这些新技术给它的服务器CPU发展奠定了扎实的基础。IBM的Power结构体系为广泛的处理器提供了技术基础,包括IBM的高端服务器芯片Power处理器,以及为计算机、服务器、手持设备和网络产品设计的PowerPC处理器。
传统PC处理器都采用CISC架构(复杂指令集),其效率相对较低,而IBM的Power处理器则是基于RISC架构(精简指令集)。尽管CISC架构能够有效地缩短新指令的微代码设计时间,并且提供非常好的兼容性,但是不同的指令长度相差很大,需要不同的时钟周期来完成,执行较慢的指令将影响整台机器的执行效率。
而对于基于RISC架构的Power处理器而言,其指令都是固定长度的,这种统一长度指令使得工程师能更轻易地设计处理器,让他们省掉一些不必要的装置来加速执行能力。
IBM Power处理器的特色是指令流水线,而且都是多级执行单一指令。事实上,不管是RISC或是CISC的整数、浮点还是SIMD单元,在不同架构中会有不同的层级变化。Power处理器的四级主要流水线分别是译码、分送、执行与单元使用,通常每个步骤只需花费处理器最小的周期来完成。由于考虑到每个单元需要不同的硬件,在不同的指令下平行执行不同的单元是处理器设计的逻辑步骤,所以Power处理器的流水线处理方式十分灵活。
Power 5大获成功
IBM在双核处理器Power 4上采用CMP技术,此时一个硅片上集成两个64位超标量微处理器核心,并且使用MCM(多芯片模块)封装方式,将4个Power4组合成一个较大的封装,类似一个8个CPU的SMP系统。
真正让多核技术大放异彩的还是IBM Power 5处理器。
IBM Power 5处理器芯片内建虚拟引擎,每个处理器的微分区技术允许定义10个动态逻辑分割区或“虚拟服务器”,可以模拟出不同服务器的环境。每部虚拟服务器可选择Unix AIX 5L、Linux或i5/OS操作系统。
Power 5另一项改进的特点是,将通用与浮点寄存器的数目从80组增加到120组,同时在许多执行单元,如指令预撷取缓冲区、指令执行状态保留区及地址转换表上有改进,以确保可以一分为二的单核心同步多线程的能力。
每个子CPU核心可以仿真成两个逻辑处理器来协同运作。这项类似于Intel超线程的技术使得每个处理器硅芯片电路相当于具备4颗逻辑处理器的能力,再加上Power 5处理器又包入4个处理器硅芯片,相当于当我们插入一颗Power 5处理器实体芯片之后,就可以开启16个逻辑处理器,将目前多处理器并行运算的能力大幅增加。
IBM多核CPU计划
IBM计划在即将发布的Power 6处理器上采用QCM封装技术,即将两个双核Power 6芯片封装到一起,构成四核的Power 6处理器。
IBM声称新的Power 6处理器的工作频率将达到4~5GHz之间,目前的样品已经可以运行在5.8GHz工作频率上,而这个时候处理器的内核温度将不会超过85摄氏度。
Power 6处理器将主要应用在IBM自己的刀片式服务器和P系列服务器产品线中。
不过,据称IBM刀片服务器中所使用的Power 6处理器工作频率大约只有4GHz左右,IBM称Power 6处理器将搭载新的节电技术,这可以让Power 6处理器在空闲状态下的功耗降低30%~35%。
Power 6有极高带宽可提供给处理器。在5GHz工作频率下,每个Power 6内核都具有300GB/s的带宽水平:大约80GB/s来自三级高速缓存、75GB/s来自内存、80GB/s来自MCM内部总线、50GB/s来自远程处理器、20GB/s来自本地的I/O设备。
Power 6的带宽比Power 5系统增加了一倍,这是由于频率提高以及添加了一些新接口的缘故。
Power 6还通过使用一个内存控制器和MCM内的结构线路,从而把I/O频率从CPU频率的三分之一提高到了二分之一。每个内存控制器使用IBM的第三代同步内存接口连接到内存。
根据英国The Register网站5月21日披露的信息显示,Oracle已经在一台配备了4块Power 6芯片的IBM p570服务器上成功地运行了Oracle 11i数据库,整体性能表现比上一代处理器提高了不少。
新的服务器系统在处理2100个用户时的平均响应时间为0.625秒。与之相对比,采用2.2GHz Power 5 处理器的IBM p570系统在处理2000个用户时的平均响应时间为0.983秒。由此可见,Power 6的整体运算能力比上一代有了很大地提升。
当其他芯片厂商开始放弃对于芯片时钟频率的追求,转而通过增加芯片核心来获得性能提升的时候,IBM却要在Power 6上保持对于频率和性能的“双丰收”。
IBM Power处理器路线图
链 接:MCM封装技术
采用MCM封装技术的Power 5处理器
虽然MCM(多芯片模块)技术近年来愈来愈热门,然而MCM技术的起源却相当地早,远在20世纪70年代IBM就已经提出。当时IBM在研制一种磁泡存储器(Bubble Memory)技术,磁泡存储器属于非挥发性存储器的一种,IBM开发此种存储器是打算将其运用在IBM自属的计算机设备中。该存储器使用了一种磁性材质的薄膜,运用薄膜来营造与保留小型的扇区,以此来进行储存记忆。这种小扇区就被IBM称之为“磁泡”,每个小扇区可以记忆一个位(bit)的资料。
不过这种技术在商业运用上并没有成功,原因在于20世纪80年代开始硬盘的崛起,使磁泡存储器在容量价格比上无法竞争,因而退淡,但当时的磁泡存储器就已经用上MCM概念的技术。
之后,MCM技术沉寂了相当长的一段时间。20世纪90年代,Intel在Pentium Pro上也尝试使用MCM技术,但是由于商业上的问题,随着Pentium Pro的沉寂,MCM技术也再度沉默。直到2001年,IBM发布Power 4处理器时,再次使用MCM,至此MCM终于随着Power芯片的成功而大放异彩。