CPU 的性能指标
2005-11-1 15:32:52 编辑:阿志 来源:来源网络
一、CPU时钟频率
所谓主频,也就是CPU正常工作时的时钟频率,从理论上讲CPU的主频越高,它的速度也就越快,因为频率越高,单位时钟周期内完成的指令就越多,从而速度也就越快了。但是由于各种CPU内部结构的差异(如缓存、指令集),并不是时钟频率相同速度就相同,比如PIII和赛扬,雷鸟和DURON,赛扬和DURON,PIII与雷鸟,在相同主频下性能都不同程度的存在着差异。目前主流CPU的主频都在600MHz以上,而频率最高(注意,并非最快)的P4已经达到1.7GHz,AMD的雷鸟也已经达到了1.3GHz,而且还会不断提升。
在486出现以后,由于CPU工作频率不断提高,而PC机的一些其他设备(如插卡、硬盘等)却受到工艺的限制,不能承受更高的频率,因此限制了CPU频率的进一步提高。因此,出现了倍频技术,该技术能够使CPU内部工作频率变为外部频率的倍数,从而通过提升倍频而达到提升主频的目的。因此在486以后我们接触到两个新的概念--外频与倍频。它们与主频之间的关系是外频X倍频=主频。一颗CPU的外频与今天我们常说的FSB(Front side bus,前端总线)频率是相同的(注意,是频率相同),目前市场上的CPU的外频主要有66MHz(赛扬系列)、100MHz(部分PIII和部分雷鸟以及所有P4和DURON)、133MHz(部分PIII和部分雷鸟)。值得一提的是,目前有些媒体宣传一些CPU的外频达到了200MHz(DURON)、266MHz(雷鸟)甚至400MHz(P4),实际上是把外频与前端总线混为一谈了,其实它们的外频仍然是100MHz和133MHz,但是由于采用了特殊的技术,使前端总线能够在一个时钟周期内完成2次甚至4次传输,因此相当于将前端总线频率提升了好几倍。不过从外频与倍频的定义来看,它们的外频并未因此而发生改变,希望大家注意这一点。今天外频并未比当初提升多少,但是倍频技术今天已经发展到一个很高的阶段。以往的倍频都只能达到2-3倍,而现在的P4、雷鸟都已经达到了10倍以上,真不知道以后还会不会更高。眼下的CPU倍频一般都已经在出厂前被锁定(除了部分工程样品),而外频则未上锁。部分CPU如AMD的DURON和雷鸟能够通过特殊手段对其倍频进行解锁,而INTEL产CPU则不行。
由于外频不断提高,渐渐地提高到其他设备无法承受了,因此出现了分频技术(其实这是主板北桥芯片的功能)。分频技术就是通过主板的北桥芯片将CPU外频降低,然后再提供给各插卡、硬盘等设备。早期的66MHz外频时代是PCI设备2分频,AGP设备不分频;后来的100MHz外频时代则是PCI设备3分频,AGP设备2/3分频(有些100MHz的北桥芯片也支持PCI设备4分频);目前的北桥芯片一般都支持133MHz外频,即PCI设备4分频、AGP设备2分频。总之,在标准外频(66MHz、100MHz、133MHz)下北桥芯片必须使PCI设备工作在33MHz,AGP设备工作在66MHz,才能说该芯片能正式支持该种外频。
最后再来谈谈CPU的超频。CPU超频其实就是通过提高外频或者倍频的手段来提高CPU主频从而提升整个系统的性能。超频的历史已经很久远(其实也就几年),但是真正为大家所喜爱则是从赛扬系列的出产而开始的,其中赛扬300A超450、366超550直到今天还为人们所津津乐道。而它们就是通过将赛扬CPU的66MHz外频提升到100MHz从而提升了CPU的主频。而早期的DURON超频则与赛扬不同,它是通过破解倍频锁然后提升倍频的方式来提高频率。总的看来,超倍频比超外频更稳定,因为超倍频没有改变外频,也就不会影响到其他设备的正常运作;但是如果超外频,就可能遇到非标准外频如75MHz、83MHz、112MHz等,这些情况下由于分频技术的限制,致使其他设备都不能工作在正常的频率下,从而可能造成系统的不稳定,甚至出现硬盘数据丢失、严重的可能损坏。因此,笔者在这里告诫大家:超频虽有好处,但是也十分危险,所以请大家慎重超频!
CPU的主频不代表CPU的速度,但提高主频对于提高CPU运算速度却是至关重要的。举个例子来说,假设某个CPU在一个时钟周期内执行一条运算指令,那么当CPU运行在100MHz主频时,将比它运行在50MHz主频时速度快一倍。因为100MHz的时钟周期比50MHz的时钟周期占用时间减少了一半,也就是工作在100MHz主频的CPU执行一条运算指令所需时间仅为10ns比工作在50MHz主频时的20ns缩短了一半,自然运算速度也就快了一倍。只不过电脑的整体运行速度不仅取决于CPU运算速度,还与其它各分系统的运行情况有关,只有在提高主频的同时,各分系统运行速度和各分系统之间的数据传输速度都能得到提高后,电脑整体的运行速度才能真正得到提高。
提高CPU工作主频主要受到生产工艺的限制。由于CPU是在半导体硅片上制造的,在硅片上的元件之间需要导线进行联接,由于在高频状态下要求导线越细越短越好,这样才能减小导线分布电容等杂散干扰以保证CPU运算正确。因此制造工艺的限制,是CPU主频发展的最大障碍之一。
二、CPU缓存
缓存(Cache)大小是CPU的重要指标之一,其结构与大小对CPU速度的影响非常大。简单地讲,缓存就是用来存储一些常用或即将用到的数据或指令,当需要这些数据或指令的时候直接从缓存中读取,这样比到内存甚至硬盘中读取要快得多,能够大幅度提升CPU的处理速度。
所谓处理器缓存,通常指的是二级高速缓存,或外部高速缓存。即高速缓冲存储器,是位于CPU和主存储器DRAM(Dynamic RAM)之间的规模较小的但速度很高的存储器,通常由SRAM(静态随机存储器)组成。用来存放那些被CPU频繁使用的数据,以便使CPU不必依赖于速度较慢的DRAM(动态随机存储器)。L2高速缓存一直都属于速度极快而价格也相当昂贵的一类内存,称为SRAM(静态RAM),SRAM(Static RAM)是静态存储器的英文缩写。由于SRAM采用了与制作CPU相同的半导体工艺,因此与动态存储器DRAM比较,SRAM的存取速度快,但体积较大,价格很高。
处理器缓存的基本思想是用少量的SRAM作为CPU与DRAM存储系统之间的缓冲区,即Cache系统。80486以及更高档微处理器的一个显著特点是处理器芯片内集成了SRAM作为Cache,由于这些Cache装在芯片内,因此称为片内Cache。486芯片内Cache的容量通常为8K。高档芯片如Pentium为16KB,Power PC可达32KB。Pentium微处理器进一步改进片内Cache,采用数据和双通道Cache技术,相对而言,片内Cache的容量不大,但是非常灵活、方便,极大地提高了微处理器的性能。片内Cache也称为一级Cache。由于486,586等高档处理器的时钟频率很高,一旦出现一级Cache未命中的情况,性能将明显恶化。在这种情况下采用的办法是在处理器芯片之外再加Cache,称为二级Cache。二级Cache实际上是CPU和主存之间的真正缓冲。由于系统板上的响应时间远低于CPU的速度,如果没有二级Cache就不可能达到486,586等高档处理器的理想速度。二级Cache的容量通常应比一级Cache大一个数量级以上。在系统设置中,常要求用户确定二级Cache是否安装及尺寸大小等。二级Cache的大小一般为128KB、256KB或512KB。在486以上档次的微机中,普遍采用256KB或512KB同步Cache。所谓同步是指Cache和CPU采用了相同的时钟周期,以相同的速度同步工作。相对于异步Cache,性能可提高30%以上。
目前,PC及其服务器系统的发展趋势之一是CPU主频越做越高,系统架构越做越先进,而主存DRAM的结构和存取时间改进较慢。因此,缓存(Cache)技术愈显重要,在PC系统中Cache越做越大。广大用户已把Cache做为评价和选购PC系统的一个重要指标。
三、CPU接口方式
我们知道,CPU需要通过某个接口与主板连接的才能进行工作。CPU经过这么多年的发展,采用的接口方式有引脚式、卡式、触点式、针脚式等。而目前CPU的接口都是针脚式接口,对应到主板上就有相应的插槽类型。不同类型的CPU具有不同的CPU插槽,因此选择CPU,就必须选择带有与之对应插槽类型的主板。主板CPU插槽类型不同,在插孔数、体积、形状都有变化,所以不能互相接插。
Socket 7:Socket在英文里就是插槽的意思,Socket 7也被叫做Super 7。最初是英特尔公司为Pentium MMX系列CPU设计的插槽,后来英特尔放弃Socket 7接口转向SLOT 1接口,AMD、VIA、ALI、SIS等厂商仍然沿用此接口,直至发展出Socket A接口。该插槽基本特征为321插孔,系统使用66MHz的总线。Super 7主板增加了对100MHz外频和AGP接口类型的支持。
Super 7采用的芯片组有VIA公司的MVP3、MVP4系列,SIS公司的530/540系列及ALI的Aladdin V系列等主板产品。对应Super 7接口CPU的产品有AMD K6-2、K6-Ⅲ 、Cyrix M2及一些其他厂商的产品。此类接口目前已被淘汰,只有部分老产品才能见到。
SLOT A接口类似于英特尔公司的SLOT 1接口,供AMD公司的K7 Athlon使用的。在技术和性能上,SLOT A主板可完全兼容原有的各种外设扩展卡设备。它使用的并不是Intel的P6 GTL+ 总线协议,而是Digital公司的Alpha总线协议EV6。EV6架构是种较先进的架构,它采用多线程处理的点到点拓扑结构,支持200MHz的总线频率。支持SLOT A接口结构的主板芯片组主要有两种,一种是AMD的AMD 750芯片组,另一种是VIA的Apollo KX133芯片组。此类接口已被Socket A接口全面取代。
SLOT 2用途比较专业,都采用于高端服务器及图形工作站的系统。所用的CPU也是很昂贵的Xeon(至强)系列。Slot 2与Slot 1相比,有许多不同。首先,Slot 2插槽更长,CPU本身也都要大一些。其次,Slot 2能够胜任更高要求的多用途计算处理,这是进入高端企业计算市场的关键所在。在当时标准服务器设计中,一般厂商只能同时在系统中采用两个 Pentium Ⅱ处理器,而有了Slot 2设计后,可以在一台服务器中同时采用 8个处理器。而且采用Slot 2接口的Pentium Ⅱ CPU都采用了当时最先进的0.25微米制造工艺。支持SLOT 2接口的主板芯片组有440GX和450NX。
SLOT 1是英特尔公司为取代Socket 7而开发的CPU接口,并申请的专利。这样其它厂商就无法生产SLOT 1接口的产品,也就使得AMD、VIA、SIS等公司不得不联合起来,对Socket 7接口升级,也得到了Super 7接口。后来随着Super 7接口的兴起,英特尔又将SLOT 1结构主板的制造授权提供给了VIA、SIS、ALI等主板厂商,所以这些厂商也相应推出了采用SLOT 1接口的系列主板,丰富了主板市场。
SLOT 1是英特尔公司为Pentium Ⅱ系列CPU设计的插槽,其将Pentium Ⅱ CPU及其相关控制电路、二级缓存都做在一块子卡上,多数Slot 1主板使用100MHz外频。SLOT 1的技术结构比较先进,能提供更大的内部传输带宽和CPU性能。采用SLOT 1接口的主板芯片组有Intel的BX、i810、i820系列及VIA的Apollo系列,ALI 的Aladdin Pro Ⅱ系列及SIS的620、630系列等。此种接口已经被淘汰,市面上已无此类接口的主板产品。
Socket 370架构是英特尔开发出来代替SLOT架构,外观上与Socket 7非常像,也采用零插拔力插槽,对应的CPU是370针脚。
Socket 370主板多为采用Intel ZX、BX、i810芯片组的产品,其他厂商有VIA Apollo Pro系列、SIS 530系列等。最初认为,Socket 370的CPU升级能力可能不会太好,所以Socket 370的销量总是不如SLOT 1接口的主板。但在英特尔推出的“铜矿”和”图拉丁”系列CPU, Socket 370接口的主板一改低端形象,逐渐取代了SLOT 1接口。目前市场中还有极少部分的主板采用此种插槽。
Socket 423插槽是最初Pentium 4处理器的标准接口,Socket 423的外形和前几种Socket类的插槽类似,对应的CPU针脚数为423。Socket 423插槽多是基于Intel 850芯片组主板,支持1.3GHz~1.8GHz的Pentium 4处理器。不过随着DDR内存的流行,英特尔又开发了支持SDRAM及DDR内存的i845芯片组,CPU插槽也改成了Socket 478,Socket 423插槽也就销声匿迹了。
Socket A接口,也叫Socket 462,是目前AMD公司Athlon XP和Duron处理器的插座标准。Socket A接口具有462插空,可以支持133MHz外频。如同Socket 370一样,降低了制造成本,简化了结构设计。
Socket 478插槽是目前Pentium 4系列处理器所采用的接口类型,针脚数为478针。Socket 478的Pentium 4处理器面积很小,其针脚排列极为紧密。采用Socket 478插槽的主板产品数量众多,是目前应用最为广泛的插槽类型。
与Socket 603相仿,Socket 604仍然是应用于Intel平台高端的服务器/工作站主板,但与Socket 603的最大区别是增加了对133MHz外频以及533MHz前端总线频率的支持,2004年随着Intel64位的支持EM64T技术的Xeon的发布,又增加了对200MHz外频以及800MHz前端总线频率的支持。Socket 604插槽可以兼容Socket 603接口的Xeon和Xeon MP。
Socket 603的用途比较专业,应用于Intel平台高端的服务器/工作站主板,其对应的CPU是Xeon MP和早期的Xeon。Socket 603具有603个CPU针脚插孔,只能支持100MHz外频以及400MHz前端总线频率。Socket 603插槽并不能兼容Socket 604接口的Xeon。
Socket 940是最早发布的AMD64位平台标准,是服务器/工作站所使用的Opteron以及最初的Athlon 64 FX所对应的插槽标准,具有940个CPU针脚插孔,支持200MHz外频和800MHz的HyperTransport总线频率,并且支持双通道内存技术。
由于Socket 940接口的CPU价格高昂,而且必须搭配昂贵的ECC内存才能使用,所以其总体采购成本是比较昂贵的。现在新出的Athlon 64 FX已经改用Socket 939接口,所以Socket 940将会成为Opteron的专用接口。
Socket 939是AMD公司2004年6月才发布的64位桌面平台标准,是目前高端的Athlon 64以及Athlon 64 FX所对应的插槽标准,具有939个CPU针脚插孔,支持200MHz外频和1000MHz的HyperTransport总线频率,并且支持双通道内存技术。
Socket 939目前的配套主板也逐渐增多,将是AMD64位桌面平台以后的主流平台。
Socket 754是2003年9月AMD64位桌面平台最初发布时的标准插槽,是目前低端的Athlon 64和高端的Sempron所对应的插槽标准,具有754个CPU针脚插孔,支持200MHz外频和800MHz的HyperTransport总线频率,但不支持双通道内存技术。
Socket 754是目前广泛采用的AMD64位平台标准,与之配套的主板非常多。关于Socket 754的前途目前众说纷纭,有说随着Socket 939的普及,Socket 754最终会被完全淘汰;也有说Socket 754接口的Athlon 64将会完全停产而只保留Socket 754接口的Sempron的......还芫烤故窃趺囱捎贏MD64平台的插槽标准过多,而且互不兼容,Socket 754应该会逐渐被Socket 939所取代。
Socket 775又称为Socket T,是目前应用于Intel LGA775封装的CPU所对应的处理器插槽,能支持LGA775封装的Pentium 4、Pentium 4 EE、Celeron D等CPU。Socket 775插槽与目前广泛采用的Socket 478插槽明显不同,非常复杂,没有Socket 478插槽那样的CPU针脚插孔,取而代之的是775根有弹性的触须状针脚(其实是非常纤细的弯曲的弹性金属丝),通过与CPU底部对应的触点相接触而获得信号。因为触点有775个,比以前的Socket 478的478pin增加不少,封装的尺寸也有所增大,为37.5mm×37.5mm。另外,与以前的Socket 478/423/370等插槽采用工程塑料制造不同,Socket 775插槽为全金属制造,原因在于这种新的CPU的固定方式对插槽的强度有较高的要求,并且新的prescott核心的CPU的功率增加很多,CPU的表面温度也提高不少,金属材质的插槽比较耐得住高温。在插槽的盖子上还卡着一块保护盖。
Socket 775插槽由于其内部的触针非常柔软和纤薄,如果在安装的时候用力不当就非常容易造成触针的损坏;其针脚实在是太容易变形了,相邻的针脚很容易搭在一起,而短路有时候会引起烧毁设备的可怕后果;此外,过多地拆卸CPU也将导致触针失去弹性进而造成硬件方面的彻底损坏,这是其目前的最大缺点。
目前,采用Socket 775插槽的主板数量并不太多,主要是Intel 915/925系列芯片组主板,也有采用比较成熟的老芯片组例如Intel 865/875/848系列以及VIA PT800/PT880等芯片组的主板。不过随着Intel加大LGA775平台的推广力度,Socket 775插槽最终将会取代Socket 478插槽,成为Intel平台的主流CPU插槽。
四、基本字长
在计算机中,算术运算可以分为定点运算和浮点运算两大类。基本字长一般是指参加一次定点运算的操作数的位数,例如8位、16位、32位或64位。基本字长影响着计算精度、硬件成本,甚至指令系统的功能。
在一次运算过程中,操作数和运算结果通过数据总线,在寄存器和运算部件之间传送。因此基本字长标志着计算精度,也反映了寄存器、运算部件和数据总线的位数。基本字长越长,操作数的位数越多,计算精度也就越高;但相应部件的位数也会增多,使硬件成本随着增高。另外,某些信息(如字符类信息)只需要用8位二进制代码来表示,8位称为一个字节。因此,为了较好地协调计算精度与硬件成本的制约关系,针对不同需求,大多数计算机允许采用变字长运算,即允许硬件实现以字节为单位的运算以及某种基本字长(如16位)运算,或双字长(如32位)运算,通过软件实现多字长运算。
指令字长与数据字长之间也有一定程度的对应关系。基本字长较长的计算机,其指令的位数可能也较多,读取指令的速度和处理指令的效率要高些,指令系统的功能相应比较强,这在传统的小型机中表现较为明显。
五、CPU制造工艺
早期的处理器都是使用0.5微米工艺制造出来的,随着CPU频率的增加,原有的工艺已无法满足产品的要求,这样便出现了0.35微米以及现在普遍使用的0.25微米工艺,不久以后,0.18微米和0.13微米制造的处理器产品也将面世。
另外一方面,现在的芯片内部都是使用铝作为导体,但是由于芯片速度的提高,芯片面积的缩小,铝线已经接近其性能极限,所以芯片制造厂商必须找出更好的能够代替铝导线的新的技术,这便是我们常说的铜导线技术。
铜导线与铝导线相比,有很大的优势,具体表现在其导电性要优于铝,电阻小,所以发热量也要小于现在所使用的铝,从而可以有效地提高芯片的稳定性,此外,采用0.18或0.13微米制造工艺以后,处理器的频率可以得到进一步的提高,处理器面积则可以进一步减小,因此,铜导线技术全面取代铝导线技术是必然的趋势。
六、扩展指令集
为了提高计算机在多媒体、3D图形方面的应用能力,许多处理器指令集应运而生,其中最著名的三种便是Intel的MMX、SSE和AMD的3D NOW!指令集。
MMX指令集是Intel在1996年发明的一项多媒体指令增强技术,其英文名称可以翻译为“多媒体扩展指令集”,它包括57条多媒体指令,这些指令可以一次处理多个数据,还可以在处理结果超过实际处理能力的时候也能进行正常处理,这样在软件的配合下,就可以得到更好的性能。
SSE指令是Intel在Pentium III处理器中首先推出的,它有70条指令,其中包含提高3D图形运算效率的50条SIMD浮点运算指令、12条MMX整数运算增强指令、8条优化内存中连续数据块传输指令。
理论上这些指令对目前流行的图像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。SEE指令与3D Now!指令彼此互不兼容,但SSE包含了3D Now!技术的绝大部分功能,只是实现的方法不同。SSE兼容MMX指令,它可以通过SIMD(单指令多数据技术)和单时钟周期并行处理多个浮点数据来有效的提高浮点运算速度。
由AMD发明的3D Now!指令出现在SSE指令之前,并被广泛应用与K6-2、K6-III以及K7处理器上,该技术其实是21条机器码的扩展指令集。与MMX技术侧重的整数运算不同,3DNow!主要针对三维建模、坐标变换、效果渲染等三维应用场合,在软件的配合下,可以大幅度提高3D处理性能。[从此长大]
|