ccidnet????

出版日期:2005-05-23 总期号:619 本年期号:19

本期导读
综合报道
硬件世界
整机与数码
软件.net
网管员天地 
教育信息化
培训与职场
读者俱乐部
双枪闯天下
——AMD双核处理器问世


  1.证明与必然性

  ——从单核到双核之路#娫

  让我们从摩尔定律说起。摩尔定律(Moore's Law)预言:“IC上可容纳的电晶体数目,约每隔18个月便会增加一倍,性能也将提升一倍。”在过去的数十年里,这条被业界奉为权威的定律从未失准,从250nm到180nm到130nm到90nm,半导体的密度如期提高,晶体管的数量如期加倍。而硬件爱好者最关注的,更确切的说是Intel所更加津津乐道的CPU频率,也一直如预言所解释的从MHz到了GHz。

  但到了近一个时期,摩尔定律却受到了很多来自业界和评论界的质疑,甚至有评论者认为,摩尔定律不再有效,并且性能翻倍和晶体管数量翻倍的时代已经过去了。悲观的论点并非没有根据,从Intel迫不得已取消了4GHz处理器的计划,到Intel前CEO贝瑞特博士在Gartner所赞助的产业大会上面对6500位业界高端人士演讲时的单膝下跪,双手合十祈求原谅,都让人隐隐感到出自于Intel的摩尔定律的前景堪忧。

  事实上,Intel取消代号为Nocona 的3.8/4GHz处理器只不过是Intel在90nm制造工艺上受挫的一个直接表现。同样,不止是Intel,AMD、IBM甚至整个半导体业界都在进入90nm制造工艺后遭遇到了诸多难题。不仅仅是制造工艺方面,还有物理学方面的因素。

  反思生产更复杂处理器面临的重要问题:与物理、化学或生产无关。问题是人力,把更多的工程师投入到设计上并不是解决的办法——设计者的数量与晶体管数量并不是依比例确定的,那意味着体系的复杂度会呈几何级数增长。这导致了处理器结构设计的可复制性。而假如处理器设计为双核心,大多数的电子元件是重复的,所以虽然晶体管的数量急剧增长了,但它和增加更多的功能模块或更深的管线级数的单核心设计是有本质的区别的。

  功耗是由晶体管数量以及时钟速度决定的,那意味着更大的发热量。双核心为了低得多的功耗而牺牲最大时钟速度,以与单核心处理器保持在相同的总体热力和功率需求范围内。下面的图表显示了时钟速度和功耗之间的关系,其中n代表具有最高时钟速度的处理器,而每个单位意味着降低0.2GHz。

  具体举例说,若n为3.6GHz,则n-1为3.4GHz,n-2为3.2GHz,依此类推。可以估略出减少两个单位的主频带来了功耗上大约40%的缩减量。而两个n-2核心的处理器由于晶体管的翻倍造成的发热量却比拥有最高时钟速度的单核心处理器n的总功耗还要低一点。

  由此,在设计处理器的工程师们为功耗和发热的问题寻找突破的时候,从另一个角度解决问题的双核心策略自然而然的为他们所接受,成为继续证明摩尔定律的最好例证:摩尔定律在一段时间内仍将继续生效,但表现的方法会不同。性能的翻倍将来自于核心数量上的增加,而不是通过时钟速度翻倍来实现;一个处理器的核心数量翻倍也将导致晶体管的数量翻倍,所以虽然时钟速度不像过去那样迅速飙升,但理论上性能应该仍然能够成倍的增长。即双核心将成为今后处理器领域的新的发展方向。


  功耗和时钟频率之间的非线性关系(横坐标为处理器频率)

  

  2. 双核心之AMD

  2005年5月12日,AMD在中国正式发布了双核心处理器,AMD双核心处理器的发布虽然晚于Intel,但其双核心发展计划应该在较早以前就制定了并一直按计划实施着。其在研发Athlon64和Opteron处理器时就已经融入双处理器架构的理念。因此它们在生产双内核处理器时将比Intel更从容。

  今年3月份AMD在国外相继发布了双核心的Opteron(皓龙)和双核心的桌面台式处理器——Athlon64 X2。64位的Opteron 已经为AMD在服务器领域取得了不错的市场份额,而由多颗双核心的Opteron组成的多路服务器更将会是今后服务器领域的热点(Opteron的直接对手Xeon暂时还没有被Intel加入双核心计划)。

  而Athlon64 X2的发布则真正代表了桌面平台双核心时代的到来。Athlon64 X2采用了两个Venice版本的Athlon64核心,核心架构上相对于目前Athlon64架构没有什么太大改变,因此Athlon64 X2的大多数技术特征、功能与目前销售基于X86-64架构939接口的处理器是一样的:继续采用Socket 939接口,核心电压1.35V,支持SSE3指令集,并且仍将使用128bitDDR内存控制器来支持双通道DDR内存和采用1GHz Hyper Transport总线与芯片组相连接。

  Athlon64 X2的每个核心拥有独立的1MB或512KB L2缓存及执行单元。核心之间的连接需要通过System Request Queue(SRQ系统请求队列)和Crossbar开关实现。Crossbar开关用来控制核心与外部的通信而SRQ则负责协调两个核心对I/O资源的争夺:当进行数据处理时,每一个核心将其请求先发送给SRQ,当获得资源之后请求将会被送往相应的执行核心,整个过程都在CPU的核心范围之内完成。另外事实上,在Athlon64 X2中用于连接处理器与外部的HT总线共有三条,只是只有一条负责CPU与北桥的连接,而另外两条由于目前没有应用被AMD屏蔽了,当需要的时候便可以重新开启。

  Athlon64 X2的最大功耗将达到110W,超过了原来939平台上最大功耗的AthlonFX 55的104W,不过原有的939主板依然能够支持Athlon64 X2。Athlon64 X2还提供了新的Cool && Quiet(降温&&降噪)技术,通过升级支持这项技术的BIOS和安装AMD mini驱动,操作系统就可以在某些情况下如系统空闲时自动降低核心的频率,以此可以降低处理器的发热量以及减少系统的功耗。另外Athlon64 X2也将支持NX bit 防病毒技术,通过阻止内存溢出来实现对系统的保护。

  从表1中来看,目前的Athlon64 X2价格如同当年64bit处理器刚发布时一样非常高昂,而其也被AMD定位于多任务/数字媒体处理领域——发挥它的类似多路处理器系统的处理复杂任务的高效率。这也是目前双核心处理器最实际的工作平台。


  双核内部构造


  双核架构示意图

  

  3.比较&&测试

  AMD和Intel这对处理器市场的对手在未来的双核心领域必然会有激烈的比拼。而现在在Athlon64 X2发布后比较Athlon64 X2和Intel的双核心桌面产品Pentium D,Athlon64 X2有着以下优势:

  1.协调两个核心通信方面,Pentium D必须要通过北桥芯片来进行,这势必要带来一定的延迟,影响整个处理器的工作速度。而Athlon64 X2的SRQ和Crossbar则可以在CPU的内部完成这一切而不需要通过外部FSB通信这一途径。这正如AMD强调的,Athlon64 X2是真正将两个核心整合在一个硅晶内核上,可以真正发挥双核心效率。Intel的双核产品则采用的是两个Packet的设计,会导致有两个核心之间传输瓶颈的问题。稍后的测试也验证了这一点。

  2.由于不需要北桥芯片的协调,现有的939平台升级Athlon64 X2双核处理器惟一要做的不过是升级BIOS,而不必将平台也一并升级来提供新的北桥支持。这便可以大幅度降低了升级或新建双核心系统的成本。而Pentium D则必须等到支持其的芯片组和主板发布和大量上市才有用武之地。

  3.相对于Intel为了降低Pentium D的发热和功耗采用了降低工作频率(Pentium D处理器的最大工作频率为3.2GHz,比目前基于Prescott核心P4 5XX系列的最大频率低了15%)和引进移动处理器中的增强型Speedstep节能技术这样的方式,AMD自己的90nm SOI(硅绝缘构造)工艺和“Dual Stress Liner”应变硅技术使得Athlon64 X2在相对于Athlon64的单核心处理器频率没有降低的情况下就能很好解决了改善发热和功耗的目的。

  除了规格上的比较,性能方面的比较更为大家所关注:测试集合了AMD和Intel目前顶级的单、双核心处理器。并且还着重针对双核心加入了多任务/多线程测试。

  测试结果表2可以看出,Athlon64 X2和Pentium D旗鼓相当,甚至在一部分的应用中领先,而其功耗却比Pentium D 低10%左右,这也确切的验证了AMD在工艺水平上取得了更大的进步。而另一方面,通过比较测试中单核心处理器和双核心处理器的得分,可以看出在大部分的日常应用(如3D游戏、压缩文件等)中,双核心处理器的表现只是和单核心处理器相当或只是领先一点;而只有在进行多线程应用(如图形设计,音/视频编码等)和多任务应用(同时运行若干个软件)时,双核心处理器的性能相对于单核心处理器才有了比较大的领先优势。即表示双核心处理器的性能发挥受程序软件的线程数量制约,目前绝大多数的单线程应用程序不能展示出双核心处理器的优势,也说明了双核心系统目前还不适合普通用户。而若想充分发挥双核心处理器,更应该努力的不是处理器开发者而是软件的开发者,就如同从32bit到64bit一样,而这需要相当的时间。