ccidnet????

出版日期:2003-10-22 总期号:1260 本年期号:79

本期导读
电脑工程师
Athlon 64对决Pentium 4!

吴东

  AMD的Athlon 64终于来了!这个被全球用户等待了太久太久的64位处理器,在历经不断延期的磨难后,终于在9月23日正式发布,来到了我们面前。它的表现究竟如何?能否让AMD追上Intel的步伐?一切谜底即将揭晓!


  AMD开始绝地大反击


  AMD近年的发展形势比较严峻,整体PC领域的不景气,自身新品推出的延缓,加上Intel不断发动的强大攻势,使得他的境况确实不容乐观。当年经典的Athlon处理器首先冲破了GHz大关,摘取了这个具有非凡意义的桂冠,一度让AMD显得意气风发。不过,随着Intel的Pentium 4逐渐成熟,处理器频率的优势逐渐发挥,他重新夺回了最强处理器的宝座,并一直保持下来,加上其出色的市场掌控能力,AMD的不利境遇可想而知。

  2002年Intel对于Pentium 4的高频战略继续顺利执行,一次次地刷新主频纪录,不仅在去年11月顺利地突破3GHz,今年6月更是达到了3.2GHz,性能上的提升显得潜力无限。另一方面,由于体系结构的限制,AMD不可能很容易地提升Athlon XP的频率,虽然Athlon系列的执行效率很高,但不断拉大的频率差距还是让它的性能逐渐跟不上Intel的脚步了。尽管AMD一直通过改进核心设计、采用新技术、新工艺以提升Athlon XP的工作频率,但频率提升的幅度依旧有限。今年2月份推出的Athlon XP 3200+实际工作频率为2.2 GHz,这已经基本到达它核心设计的极限,想再提高非常困难,而增加二级缓存容量以及提高前端总线速度对提升Athlon XP性能的帮助也是有限的,所以AMD迫切需要新一代的处理器来接棒。

  Athlon系列的“性能危机”早已存在,毕竟它已经问世了4年多,从时间上算也应该功成身退了,它已经凭实际表现证明了自己是一款非常出色的产品。对于自己的不利局面,AMD也很清楚,他准备用来替代Athlon系列的就是新一代的Athlon 64系列,名为“ClawHammer”的核心代号也早已为大家所熟悉,但其产品研发的时间远远超出人们的预料。本来有消息称Athlon 64去年9月就能问世,但可惜最终被证实推迟了,这一等就是一年,其间AMD在其研发团队的不懈努力下,解决了很多核心设计和生产工艺方面的难关,终于使Athlon 64在9月23日得以推出。


  创新的AMD64架构设计


  既然是AMD的新一代处理器,Athlon 64当然具有新型的架构设计,这就是AMD64架构。早在今年2月的时候,AMD就展示了基于AMD64架构的64位处理器产品,这就是针对工作站和服务器市场的Opteron处理器(核心代号为Sledgehammer),它已于4月22日正式推出,而现在轮到针对个人桌面系统的Athlon 64上阵了。AMD64架构首要的特点当然就是可以支持64位的指令代码,这点是通过对传统的32位X86架构进行64位扩展来实现的,这样做的好处是它在构建起64位X86平台的同时,仍旧可以很好地向下兼容原来的32位指令代码,这就使现在成千上万的32位应用软件依旧可以顺利运行,很好地保护了用户在现有X86解决方案方面的投资。类似这样的做法其实以前就有过,当年Intel的80386处理器也正是对X86 16位架构进行32位扩展来实现支持32位指令代码的,最终逐步实现16位平台到32位平台的平稳过渡。

  目前流行的32位操作系统和应用软件可以进行4GB的内存寻址,4GB内存对于2D图像处理、3D图形制作、大型数据库等高端应用来说有时并不太够,因为它们对内存容量的需求总是多多益善,因此对于64位平台具有的TB级(1TB=1024GB)内存寻址能力会很有兴趣。即使是对于面向个人用户的一般应用来说,虽然现在4GB内存是完全足够的,但从发展的眼光看,应用的不断升级将逐渐使它们向拥有更大寻址空间的64位平台迁移,这一切只是时间问题。在个人电脑领域中,Apple(苹果电脑)的Macintosh体系已经通过新一代G5系统的上市抢先进入了64位领域,现在AMD的Athlon64也将尝试PC体系的64位化,而在64位操作系统方面,除了Redhat和Suse等Linux操作系统,微软的64位版本Windows XP已经开发了很久,可望在明年第一季度正式推出,所以整个个人电脑领域向64位平台过渡绝对是大势所趋。

  考虑到现阶段的操作系统和应用软件均为32位版本,所以让它们运行得更快也是AMD64架构要实现的重要目标。AMD首先在核心设计部分进行了增强,AMD64架构的通用寄存器以及SIMD寄存器的数量都达到了16个,而Athlon XP都是8个,当然这些新增的寄存器主要是在64位环境下才有效。另外,AMD64架构开始支持SSE2指令集,目前越来越多的应用软件开始对SSE2指令集优化,这对于提高它们的运行性能无疑很有好处。AMD64架构的一级缓存容量与 Athlon XP一样仍为128KB,对二级缓存容量则进行了扩充,达到了1MB(“Barton”核心Athlon XP为512K),而一级缓存与二级缓存之间的总线位宽提升为128位(Athlon XP为64位),这两方面与“Barton”核心Athlon XP相比都有了成倍的提高,对性能发挥也很有帮助。之前曾有消息称,AMD64架构可能会使用双物理核心的设计来进一步增强性能,因为IBM在它的Power4处理器上早已成功实现了内置多物理核心。考虑到AMD和IBM在技术合作上的亲密关系,所以这点确实是有可能的,可最终被证实并非如此,估计是AMD觉得现在实现条件还不够成熟,所以暂时没有采用。

  值得特别强调的是,处理器直接整合内存控制器也是AMD64架构的一大创新!与传统设计中内存控制器内置于北桥芯片,通过前端总线与处理器进行数据交换的方案相比,处理器整合内存控制器后,内存控制器可以与处理器内核同速运行,这不仅可以大为减少内存读取的延迟,由此取消了前端总线结构也可以最大限度减少以往这方面普遍存在的传输瓶颈,大幅提升数据传输的效率。当然集成内存控制器的设计也不是没有缺点,一旦新型的内存规格出现,要想支持它就必须更改处理器的内部设计,这种改动并不是太容易,所以可能显得不够灵活,但考虑到它带来的好处,还是利大于弊的。AMD64架构还对I/O部分进行了强化,通过双向16位的HyperTransport总线,数据传输带宽可达6.4GB/s,应付对各类外围I/O设备的访问绰绰有余,特别适合大数据流的连续传输。


  测试平台说明:


  CPU:Athlon 64 FX 51(2.2 GHz)

   Pentium 4 EE 3.2G(800MHz FSB)

  主板:华硕SK8N(nForce 3 Pro150芯片组)

   华硕P4C800 Deluxe(i875P芯片组)

  内存:2条512MB Registered DDR400(Athlon64 FX系统)

   2条512MB Kingston DDR400(Pentium 4系统)

  硬盘:西部数据 WD800JB 80GB

  显卡:nVIDIA GeforceFX 5900 Ultra 256MB

  操作系统:英文Windows XP + SP1 + DirectX 9.0b

  主板驱动:nVIDIA nForce芯片组驱动2.45版

   Intel芯片组驱动5.0.2.1003版

  显卡驱动:nVIDIA公版44.03 版

   WHQL驱动For Win2000/XP


  直面Athlon 64系列


  通过对AMD64架构的介绍,相信大家对Athlon 64的核心设计已经有了大致了解,我们接着来具体看看Athlon 64系列的构成。Athlon 64系列由Athlon 64 FX和Athlon 64两个成员构成,它们集成大约1亿零590万个晶体管(Athlon XP 3200+为5430万个),均采用0.13微米SOI(Silicon On Insulator,硅绝缘层)工艺,具体的生产是由在德国的Fab30工厂负责。其中Athlon 64 FX面向追求绝对性能的高要求用户,提供系列中最强的运算性能,它采用Socket 940接口,内部集成双64位DDR内存控制器来实现双通道DDR内存技术,支持DDR400、DDR333、DDR266、DDR200规格的ECC Registered内存,最大内存带宽可达6.4GB/s。而Athlon 64面向主流用户,采用Socket 754接口,内部只集成一个64位DDR内存控制器,不支持双通道DDR内存技术,支持DDR400、DDR333、DDR266、DDR200规格的普通unbuffer内存,最大内存带宽为3.2GB/s。从对内存的支持规格看,Athlon 64 FX要求的Registered内存价格比较昂贵,因此AMD对它的定位也相应较高,而Athlon 64显然规格比较平民化,更适合一般用户使用,不过内存带宽较小会限制它的性能发挥。

  我们最近收到了AMD送测的Athlon 64 FX测试系统,它将与Intel最强大的Pentium 4系统进行全面的对比测试。Athlon 64 FX处理器的外形与Opteron处理器基本一样,像个大个的P4处理器,其采用陶瓷PGA封装,上面加装了类似P4处理器上的金属盖,可以起到保护核心和加强散热的作用,这点比Athlon XP要好得多。作为AMD目前的旗舰产品,这款Athlon 64 FX工作于2.2GHz,不过其具体名称既不是Athlon 64 FX 2.2G,也不是像Athlon XP那样的PR值,而是叫做Athlon 64 FX 51,其售价高达733美元。据AMD介绍,Athlon 64 FX的命名不会使用PR值,而是按51、53、55、57……往下排,其实际频率有把握逐渐上升到2.7 GHz,是否能更高就要看生产工艺的后续发展了。当然,面向主流用户的Athlon 64仍会继续使用PR值来标注具体名称,目前发布的是Athlon 64 3200+,其实际工作频率为2.0GHz,千颗单价为417美元。

  这套送测系统使用了华硕的SK8N主板,它采用了nForce 3 Pro150芯片组,上面配备了两条512 MB、DDR400规格的Registered内存和GeforceFX 5900 Ultra图形卡。尽管送测系统的其它配置也堪称豪华,但为了更好地与Pentium 4系统对比,我们只选用了它的核心部件,包括处理器、主板、内存和图形卡。考虑到现在的应用现状,我们还无法进行64位应用软件的测试,所以在操作系统的选择上,这次测试我们仍使用一般的Windows XP,在它基础上测试Athlon64 FX运行现有32位软件的性能。AMD同时也给我们提供了一套测试版本的64位Windows XP,使用当中整体感觉与普通Windows XP并无差别,不过在测试中我们发现它还有些问题,一些测试项目不能正常运行,所以最终放弃了这部分的测试。

  在组建最强大的Pentium 4系统时,本来我们打算使用Pentium 4 3.2G处理器,可Intel为了狙击AMD推出Athlon 64 FX,他以闪电般的速度提前在9月中IDF大会(英特尔信息技术峰会)上发布了3.2G的Pentium 4 EE(Extreme Edition)处理器。与原来的Pentium 4 3.2G相比,Pentium 4 EE 3.2G处理器最大的特点就是额外集成了2MB三级缓存(这点与Intel面向服务器领域的Xeron MP处理器类似,当然容量不同),其它方面则基本没有变化。为Pentium 4加入三级缓存后,无疑会因为集成晶体管数量剧增(达到了1亿零800万个)而导致生产难度和成本大幅上升,但此举可以降低系统总线数据传输瓶颈的影响,对于Pentium 4这种长运算流水线、高工作频率的处理器架构来说,显然会有益于提高系统的整体性能。这款呼啸而至的Pentium 4 EE 3.2G处理器已经成为Intel最新的旗舰级产品,它将捍卫Pentium 4家族的性能王座,因此我们也顺理成章地转而使用它来代表Intel出战。下面开始正式的测试过程,谁胜谁负马上就会见分晓。

  处理器子系统性能

  既然是Athlon 64和Pentium4这两大处理器体系的对抗,首先考察这两套测试系统在处理器子系统方面的表现似乎也是理所当然的,为此我们使用Sandra MAX3众多测试项目中专门针对处理器方面的两个测试项目进行相关测试。在我们以往进行这两项测试时,最终结果显示在大多数情况下往往是工作频率更高的系统会获得胜利。Pentium4 EE 3.2G系统在这方面的优势不言而喻,加上超线程技术的助力,它的成绩明显领先Athlon 64 FX 51系统。尤其是对于SIMD多媒体指令的处理,Athlon 64 FX 51系统和Pentium4 EE 3.2G系统的差距还是比较大的,看来这方面还是Pentium4更有优势,毕竟Athlon 64 FX 51的频率整整低了1GHz,其处理器子系统部分还不足以与Pentium4 EE 3.2G相抗衡。


  Sandra MAX3 CPU Multi-Media


  Sandra MAX3 CPU Arithmetic

  内存子系统性能

  Sandra MAX3的内存带宽测试可以很好地反映出内存子系统的效率,它的成绩是分析具体软件运行表现的重要参考依据。Athlon 64 FX系统的成绩非常优秀,领先于Pentium4系统,尽管从理论内存带宽来说两者都是6.4GB/s,但Athlon 64 FX系统的实测成绩已达到5.5GB/s,其内存执行效率要更高一些,可见处理器整合内存控制器技术的设计确实功效不凡。


  Sandra MAX3 Memory Bandwidth

  商业办公性能

  Business Winstone 2002的成绩用来体现系统的商业办公性能,如Word、Excel、Netscape Communicator等软件的运行性能。这个测试涉及大量的小数据块传输,缓存容量、内存以及磁盘的数据存取效率都会对成绩造成较大影响。在这方面2套系统的成绩有着较明显的差距,Athlon 64 FX系统超过了Pentium4 EE 3.2G系统5分多,它在内存和I/0方面的优势帮助它取得了胜利。


  Business Winstone 2002 1.0

  多媒体内容创建性能

  Content Creation Winstone 2003的成绩用来测试系统的Web、图形和多媒体等内容创建性能,如Adobe Premiere、Adobe Photoshop和Macromedia Dreamweaver等软件的运行性能。Content Creation Winstone测试中包含的应用软件处理数据时往往以高速连续的大数据流为主,对内存的连续读取性能、I/O性能都要求较高。以往这方面一直是Pentium4系统的强项,而这次Athlon 64 FX系统凭借内置内存控制器的优秀设计超过了Pentium4 EE 3.2G系统。


  Content Creation Winstone 2003 1.0

  Direct3D类游戏性能

  在现在最流行的3D游戏软件中,属于Direct3D范围的游戏占据了绝大部分,因此系统在运行这类游戏时能有什么样的表现也很受广大用户的关注。为了考核两套测试系统在这方面的性能,我们使用了3DMark2001 SE和3DMark03这两个软件来进行测试。其中3DMark2001 SE无疑早被公认为是权威的Direct3D性能测试软件,它主要用来体现现有的Direct3D类游戏,而3DMark03则用来展现未来的Direct3D类游戏,我们希望两者的结合能够最大限度地代表这类游戏的情况。从测试成绩你可以看出,两套系统的表现非常接近,3DMark2001 SE中Athlon 64 FX 51系统稍占上风,而到了3DMark03中又变成Pentium4 EE 3.2G系统微幅胜出,但之间的差距都很小,总之两者在这方面势均力敌,它们都可以满足那些狂热游戏玩家的需求。


  3DMark2001 SE Build 330


  3DMark03 Build 330

  OpenGL类游戏性能

  我们使用Quake 3 Arena来测试系统运行那些OpenGL类游戏的实际表现,尽管Quake 3 Arena已经推出很久了,但可能只有idsoftware自己未来推出的游戏大作才能替代它在这方面的地位,因此我们还特意加入了idsoftware还处于开发阶段中的DOOM 3测试版本进行相关测试,希望通过它来预览两套系统运行未来新一代OpenGL类游戏时的表现。显然,在Quake 3 Arena中,Athlon 64 FX系统的表现与Pentium4 EE 3.2G系统相比仍稍逊一筹,看来Quake 3之王的称号仍旧被Intel牢牢掌握。DOOM 3这个测试的结果很有意思,640×480分辨率时Athlon 64 FX系统领先不到2帧,而当测试分辨率提高到800×600后,又变成Pentium4 EE 3.2G系统领先2帧,两套对比系统的表现基本持平。总的来说,在OpenGL类游戏中,Pentium4 EE 3.2G系统更具优势。


  Quake3 Arena 1.17 Demo001


  DOOM Ⅲ Alpha 0.02 Demol

  MPEG4视频压缩性能

  视频压缩是消耗系统资源的重要应用,而且越来越多的用户开始涉及MPEG4格式视频压缩类应用,所以它对一般用户的实际意义日渐增大,我们采用Flaskmpeg(Divx编码采用Divx 5.0.4 Codec)软件来测试各系统把DVD影片压缩成AVI格式MPEG4视频文件时的表现。对于这类视频压缩应用来说,系统中处理器的运算性能很重要,Pentium4 EE 3.2G的超线程技术在这方面大显身手,从而在测试中占据了较明显优势,比Athlon 64 FX系统快了将近半分钟。


  Flaskmpeg+Divx 5.0.4

  (时间越短越好)

  3D图形渲染性能

  3ds max系列是3D图形领域里最流行的3D建模软件,场景的最终渲染过程是典型的处理器重负载应用,能充分地考察出CPU的运算能力。3ds Max 5已经针对SSE/SSE2指令集进行了极大的优化,可以大幅提高支持SSE/SSE2指令集系统的渲染性能。从3ds max的实际渲染结果看,这次Athlon 64 FX系统获得了领先,估计新加入的SSE2指令集支持应该对它的获胜有所帮助,不过优势并不大,比Pentium4 EE 3.2G系统只缩短了9秒的时间。


  3ds max 5.01

  (时间越短越好)

  专业级3D图形性能

  考虑到两套测试系统都是定位较高的顶级平台,最后我们还使用SPEC Viewperf7.1对它们的专业级3D图形性能进行了参考性测试,作为权威的专业综合测试软件,基于实际应用设计的SPEC Viewperf7.1的地位无可替代。在SPEC Viewperf7.1的6个测试项目中,Athlon 64 FX 51系统总体来说处于劣势,除了dx-08测试项小胜外,其他都落后于Pentium4 EE 3.2G系统,而且某些项目的差距还很大。SPEC Viewperf7.1的测试涉及大量的顶点和光源运算,I/O以及内存性能方面的优势在这里没能发挥作用,Athlon 64 FX 51工作频率较低导致的较差浮点运算能力使它在这方面的表现不够理想,而Pentium4 EE 3.2G系统的高工作频率则有了用武之地,其优秀的表现令人钦佩。


  SPEC Viewperf 7.1

   在这次众多的测试项目中,Athlon 64 FX 51系统与Pentium4 EE 3.2G系统的成绩对比情况可谓是犬牙交错,双方各有胜负,但综合来看两者的表现几乎旗鼓相当,很难说其中一方战胜了另一方,总之它们都可以飞快地运行现在的各类软件,选择它们其中的任何一个都可以获得空前强大的运算性能。

  对于Athlon 64 FX 51处理器,我们认为AMD的这款最新力作运行32位软件时表现不错,考虑到它还能支持未来的64位软件,应该对部分用户确实很有吸引力。当然同时我们也很佩服Intel的技术储备实力,横空出世的Pentium4 EE顺利地保持住了Pentium4家族的不败纪录,同时也将intel平台的性能水平再度提升到了新的高度。

  不知道国内最快什么时候能看到报价733美元的Athlon 64 FX 51,而Pentium4 EE 3.2G可能会在11月中上市,国外售价预计在925美元,总之这两款产品的高生产成本决定了它们的产量不会很大,价格也都比较昂贵,当然作为双方的顶级处理器产品也并不奇怪。尽管Pentium4 EE 3.2G本身的售价要高于Athlon 64 FX 51,但在配套主板和内存方面却占据着优势,它搭配的主板生产成本较低,使用的普通DDR400内存价格更是远远低于Athlon 64 FX必须的Registered DDR400,所以最终的购置成本差不多。

  因为Athlon 64 系列设计复杂,这必然造成生产上的一定难度,要想大量供应市场并不容易,而且初期的价格也比较昂贵,希望那些AMD的支持者们不会因此而失望。AMD除了要提高处理器的产量,进一步提升工作频率对于今后的竞争无疑也很重要,因此改进生产工艺非常必要,这方面Intel显然处于领先地位,而AMD在这方面还需要付出很多努力。在目前的状况下,谁也无法预言Athlon 64系列的未来,我们还是让时间来慢慢验证吧。