登录社区:用户名: 密码: 忘记密码 网页功能:加入收藏 设为首页 网站搜索  

文档

下载

图书

论坛

安全

源码

硬件

游戏
首页 信息 空间 VB VC Delphi Java Flash 补丁 控件 安全 黑客 电子书 笔记本 手机 MP3 杀毒 QQ群 产品库 分类信息 编程网站
 内容搜索 网页 下载 源代码
您现在的位置:立华软件园->硬件天地->DIY专区->CPU
CPU全接触(三)
发表日期:2006-09-11作者:[转贴] 出处:小熊在线  

AMD

  AMD是一家值得敬佩的公司,要不是它紧紧咬住Intel不放,我们现在就不能买到如此便宜的CPU了。Intel一直想把AMD扼杀掉。 Intel在486之后就再也没有出过以阿拉伯数字命名的CPU,而是推出了一个拉丁文的Pentium,AMD也随即推出了自己设计并且生产的K5 CPU。K5系列CPU的频率一共有六种:75MHz/90 MHz /100 MHz /120 MHz /133 MHz /166 MHz,总线的频率和Pentium差不多,都是60 MHz或者66MHz。作为一款与Pentium竞争的产品,AMD的确做得非常出色,虽然在浮点运算方面比起Intel的来说是略逊一筹,但是在整数运算方面却一点也不比Intel差,由于K5系列CPU都内置了32KB的一级缓存,比Pentium内置的16KB多出了一倍,再加上它的体系结构一直比Intel的先进一些,因此在整数运算和系统整体性能方面甚至要比同样时钟频率的Pentium要高。

  K6: K6这款CPU的设计指标是相当高的,具有MMX技术、更多的片上一级高速缓存(32K指令、32K数据)和更深的流水线,可以并行地处理更多的指令,并运行在更高的时钟频率上。在整数运算方面,AMD无疑是做得非常成功的。由于K6具有更大的L1缓存,所以随着频率的增长,它能获得比Pentium MMX更显著的性能提升。K6稍微落后的地方是在运行需要使用到MMX或FP(浮点指令)的应用程序方面,比起同样频率的Pentium MMX,甚至没有MMX的奔腾都要差许多,这样就使K6在某些3D游戏方面的表现远不如Intel的出色了。另外,AMD的MMX单元一次只能处理一条指令,而Intel的MMX单元能够处理两条指令。因此K6 在执行MMX指令和浮点指令时性能要差一些。

  AMD的K6在处理某些MMX操作的时候具有比Intel的CPU更短的处理周期,但单个操作的吞吐量是一样的,而且较短的处理周期并不能弥补K6不能同时处理两个MMX指令的不足。虽然Intel的MMX CPU可以同时处理两个MMX指令,但它的MMX单元只含有一个乘法单元和一个移位单元,所以它不能同时进行这些关键操作。而且同时只能有一个MMX指令操作内存和整数寄存器在浮点处理方面起作用,因此K6在某些操作上的处理周期仍比Intel的短,但它每两个时钟周期才能开始一个操作,而Intel的芯片可以每个周期开始一个。最终的结果是对于许多浮点操作来说,AMD的芯片的吞吐量只能达到Intel芯片的一半。

  K6系列CPU一共有五种频率,分别是:166 MHz /200 MHz /233 MHz /266 MHz /300 MHz,五种型号都采用了66 MHz外频,但是后来推出的233 MHz /266 MHz /300 MHz已经可以通过升级主板的BIOS而支持100 MHz外频,是CPU的性能得到了一个飞跃。在倍频方面,K6系列是从2.5~4.5不等,核心电压则是有2.9V,3.2V,2.2V三种,特别值得一提的是他们的一级缓存都提高到了64KB,比MMX足足多了一倍,这也是K6的整数性能为什么要比MMX好的缘故了。

  1998年中,AMD最新K6-2处理器正式推出。这是首款采用3Dnow!技术的微软视窗操作系统兼容型X86微处理器。它采用了全新的硅晶体制造技术(C4倒装),这是由IBM开发的技术,将硅晶精度提高到了0.25微米,硬是将原来K6晶体面积(Die size)的168mm2降到了现在的68mm2,同时晶体数量也增加了50万个(成为930万个),其余结构基本同K6相同,L1 CACHE仍是64KB,但它的面积也比以前的小了,仅有原来的1/2大。此外它的工作电压也从2.9V/3.2V降到了2.2V。AMD在推出K6-2 CPU时,就率先加入3Dnow!浮点/3D加速技术,64位双路浮点缓存器,21条全新的3Dnow!指令集,加入单指令多数据指令(SIMD:Single Instruction,MultiDatas)。而AMD的3Dnow!技术,也随着K6-2的推出,立刻获得游戏厂商、软件厂商和图形卡驱动程序的支持,成为一项重要的工业标准。

  K6-3处理器采用0.25微米线程,由二千一百三十万个晶体管组成。K6-3处理器是三层高速缓存(TriLevel)结构设计,K6-3处理器核心内建有64K的第一级高速缓存(Level 1)及256K的第二层高速缓存(Level 2),主机板上则配置第三级高速缓存(Level 3)。K6-3处理器的第一与第二层高速缓存总共320K,全部内建在处理器芯片核心内,与处理器的时钟频率相同,此高速缓存的执行速度与处理器同速运作(Full Speed)。K6-3的三层高速缓存(TriLevel)结构设计,可再支持配备在主机板上的1024K第三级高速缓存,在Super 7结构的主机板上,第三层高速缓存的时钟频率是100MHz。相较于Pentium Ⅱ仅具有32K第一层高速缓存与512K半速的第二层高速缓存,AMD的三层高速缓存结构能加大系统的高速缓存容量,以提升系统整体效能。

  K6-3处理器支持3D Now!指令集。3D Now!指令集与英特尔的KNI(Katmai New Instruction)指令集的功能类似,都是采用增加指令的方法加快3D绘图等多媒体处理及需要运用大量浮点运算的应用程序的运算速度。

  由于成本上和成品率方面的问题,K6-3处理器在台式机市场上并不是很成功,因此它将逐渐从台式机市场消失,将逐步转进笔记本市场。AMD将推出专供笔记型计算机使用的K6-3+版本处理器,K6-3+采0.18微米线程,芯片内建第二级高速缓存,除此,笔记型K6-3+将拥有自动升降电压的双模式功能(AMD代号为Gemini),类似于英特尔下一步将推出的笔记本型处理器。使用室内交流电供电时,K6-3+处理器拥有较高的时钟频率;若使用电池供电,则K6-3+处理器将自动降速,以延长电池的寿命。

CPU全接触(三)

  真正让AMD扬眉吐气的是原来代号K7Athlon处理器。Athlon具备超标量、超管线、多流水线的Risc核心(3Way SuperScalar Risc core),采用0.25μ微米工艺,集成2,200万个晶体管,管芯面积为184mm,目前已经推出了更先进的0.18μ微米工的Athlon。下一步就是采用铜配线技术,AMD在制造工艺上向来就不落后于Intel。(图片athlon.jpg)

  Athlon包含了三个解码器,三个整数执行单元(IEU),三个地址生成单元(AGU),三个多媒体单元(就是浮点运算单元),Athlon可以在同一个时钟周期同时执行三条浮点指令,每个浮点单元都是一个完全的管道。K7包含3个解码器,由解码器将解码后的macroOPS指令(K7把X86指令解码成macroOPS指令,把长短不一的X86指令转换成长短一致的macroOPS指令,可以充分发挥RISC核心的威力)送给指令控制单元,指令控制单元能同时控制(保存)72条指令。再把指令送给整数单元或多媒体单元。整数单元可以同时调度18条指令。每个整数单元都是一个独立的管道,调度单元可以对指令进行分支预测,可以乱序执行。K7的多媒体单元(也叫浮点单元)有可以重命名的堆栈寄存器,浮点调度单元同时可以调度36条指令,浮点寄存器可以保存88条指令。在三个浮点单元中,有一个加法器,一个乘法器,这两个单元可以执行MMX指令和3DNow指令。还有一个浮点单元负责数据的装载和保存。由于K7强大的浮点单元,使AMD处理器在浮点上首次超过了Intel的处理器。

  Athlon内建128KB全速高速缓存(L1 Cache),芯片外部则是1/2时频率、512KB容量的二级高速缓存(L2 Cache),最多可支持到8MB的L2 Cache,大的缓存可进一步提高服务器系统所需要的庞大数据吞吐量。
Athlon的封装和外观跟Pentium Ⅱ的SECC卡匣相似,但Athlon采用的是Slot A接口规格。Slot A接口源于Alpha EV6Bus,时钟频率高达200MHz,使峰值带宽达到1.6GB/S,在内存总线上仍然兼容传统的100MHz总线,现在的PC-100 SDRAM还是可以用的,这样就保护了用户的投资,也降低了成本。今后还可以采用性能更高的DDRSDRAM,这和Intel力推的800MHz RAMBUS的数据吞吐量差不多。EV6总线最高可以支持到400MHz,可以完善的支持多处理器。所有具有天生的优势,要知道Slot1只支持双处理器而SlotA可支持4处理器。SlotA外观看起来跟传统 242pin的Slot1插槽很像,就像Slot1插槽倒转180度一样,但两者在电气规格、总线协议是完全不兼容的。Slot 1/Socket370的CPU,是无法安装到Slot A插槽的Athlon主板上,反之亦然。
AMD为了进一步扩大3Dnow!软件平台的支持范围,同时拉近原先3Dnow!与SSE之间的差距,在Athlon处理器中提供了Enhanced 3Dnow!技术,新添加了24条指令。其中19条控制指令,刚好跟Intel在PentiumⅢ的SSE指令中,针对现有的64位MMX缓存器所添加的视频运算、内存快速预先读取指令是完全兼容的,因此针对PentiumⅢ的SSE指令集开发的软件,只需少许修改就能顺利转移到Athlon上,发挥强悍的MMX缓存器的SIMD加速性能。另一方面,Athlon增加5条新指令,可以使CPU像DSP芯片一样直接处理模拟/数字信号的转换工作。它可以运用在软调制解调器(Soft Modem)、ADSL网络转换传输及Dolby AC-3的解码上,而Intel的CPU到目前为止,还未提供类似功能的指令。显然在新一代处理器指令集的开发中,AMD又再度发挥了创新精神。

  讲了这么多,Athlon处理器实际效能如何呢?以同样是600MHz的Athlon与600MHz PentiumⅢ相比较(Xeon目前只到550MHz而已),Athlon的整数性能(CPUMark99、WinStone99),比同频的PentiumⅢ快了10%左右;而浮点性能更是Athlon扬眉吐气之处,WinBench99的FPUmark测试值虽然仅仅快了8%左右,但是以跨平台工业评估标准的SPECfp_base95的测试结果,则快了约38%;在3D性能方面, 3D WinBench的3D Winmark以及3DMark 99 Max等软件的测试下,均领先36~38%。在运行3D Studio Max R3.0时, Athlon平台在着色处理(Rendering)的速度,大约比PentiumⅢ快了33%。由于PentiumⅢ与PentiumⅢ Xeon的差别在于L2缓存的容量与速度(Xeon为全速L2缓存),如果拿只有512KB L2缓存的入门级Xeon处理器来比较,跑大多数软件时,Xeon只有整数性能比PentiumⅢ快一点,浮点性能两者完全相同。因此在Athlon vs PentiumⅢ&Xeon的实测结果,1/2频率的L2 Cache设计的Athlon,在任何软件的表现上都击败全速L2 Cache设计的Xeon处理器。

  最近AMD又推出了800MHz的Athlon;Athlon 800MHz处理器仍是SlotA结构,不过新款式的Athlon处理器皆是K75核心,800MHz的Athlon处理器即已采用0.18微米铝工艺,晶圆面积为102平方厘米,比起采用0.25微米线程制造的旧款式Athlon处理器,800MHz款式发热更低。

  由AMD公布的Athlon处理器与Pentium Ⅲ处理器效能测试数据显示,在Business Winstone 99(Windows NT 4.0)部分,Athlon 800MHz的测试值是42.5,Athlon 750MHz是41.4,Pentium Ⅲ 733MHz是41.3;在WinBench 99CPUmark 99部分,Athlon 800MHz的测试值是71.9,Athlon 750MHz是67.9,而Pentium Ⅲ 733MHz是65.8;在WinBench 99 FPU WinMark部分,Athlon 800MHz的测试值为4,370,Athlon 750MHz为4,103.3,Pentium Ⅲ 733MHz为3,890。

  因此AMD把Athlon处理器的定位,锁定在Xeon的等级,在价位上则定位在Xeon到PentiumⅢ之间,希望能打入商业、高阶工作站、服务器的市场,这应该是很具竞争力的市场策略。

我来说两句】 【发送给朋友】 【加入收藏】 【返加顶部】 【打印本页】 【关闭窗口
中搜索 CPU全接触(三)
关于我们 / 合作推广 / 给我留言 / 版权举报 / 意见建议 / 广告投放 / 友情链接

Copyright ©2001-2003 Allrights reserved
e_mail:站长:webmaster(at)lihuasoft.net
网站编程QQ群  
京ICP备05001064号

页面生成时间:0.00225