ccidnet????

出版日期:2005-02-21 总期号:1388 本年期号:11

本期导读
要闻综合
中国信息化
网络与通信
产品与应用
渠道与市场
华东专刊
华南专刊
TOP500排行即将改写
美日更新HPC评价标准
文 本报记者 谢文砚

  转眼间,1993年开始的全球HPC TOP500榜单已发布了24届,半年一次的榜单发布虽无奥斯卡式的华美典礼相伴,但榜上的每一个名字背后都凝聚着众多科学家的心血,也直接代表着国家实力。现在,沿用了12年的Linpack评价体系即将发生变化,这意味着什么?

  中科院计算所高性能服务器评测实验室主任冯圣中博士认为:“这套评测基准无疑要比单纯使用Linpack(HPL)要更全面。”

  中科院计算所国家智能计算机研究开发中心主任孙凝晖博士则指出:“Linpack指标反映的是CPU的计算能力。HPC Challenge更全面一些,除计算能力外,内存访问、互连网络的能力也包括在内。”

  中科院软件研究所并行计算实验室的张云泉博士表示:“我们目前正在关注的是首先从并行FFT测试作为突破口。”

  清华大学计算机系副教授陈文光则认为:“HPCC是优缺点并存的。HPCC比起Linkpack来,从刻划系统底层指标的角度来看前进了一步,主要增加了内存访问和网络传输的评价,为进一步对系统和程序进行建模分析提供了良好的基础。”


  现在打开手边的电脑,您就可在http://icl.cs.utk.edu/hpcc/网站上看到美日两国的49套HPC系统参加了新的HPC挑战标准(HPC Challenge Benchmark)。

  该标准是在美国政府的资助下以美国田纳西大学J.Dongarra博士为主,由日美两国的HPC人员参与制定的。目的是对以往在业界最流行的高性能计算机的性能排名,即全球500强中使用的Linpack指标进行补充,以便从各种角度对高性能计算机的性能进行评测。除计算机的运算性能外,HPC挑战基准还能对内在访问性能、并行处理库MPE(信息传递接口)的通信性能等多种功能进行综合测试。

  对此标准的前景,国内外的学术界和业界专家观点不一。

  目前,高性能计算机性能评价受到前所未有的广泛关注,主要是因为业界面临着严峻挑战:一方面,超级计算机的理论峰值按摩尔定律在迅速提高、机群成为主流架构,似乎只要有钱,多大的机群都可以造出来;另一方面,几乎所有实际应用(气象、石油、机械等等)在超级计算机上的运行效率不到10%,有的甚至低于1%。而在TOP500中,多数机器Linpack效率高于60%。为什么?是实际应用优化的不够吗?应该说,如果能像优化Linpack性能那样,对每一应用去做精心优化,在一定条件下,提高效率在理论上还是有可能的。但实际上,首先是因为应用太多,其次是因为用户使用模式千差万别(例如计算的规模就不可能规定死),因此,逐一优化的代价会相当高!

  因此,中科院计算所高性能服务器评测实验室主任冯博士认为,业界应该做更多的创新,从根本上解决问题,即研制更好的计算机,使应用不需要特别费功夫去优化,就可以获得较好的性能。单从解决这个问题的角度看,高性能计算技术还远没有成熟。

  据介绍,冯博士领导的实验室从2001年开始,就参与了以“应用计算行为分析”为核心的高性能计算性能评价与优化研究工作。“包括这七个基准测试程序,我们都做过分析和测试。当然,我们更关注的是实际应用的分析、测试和优化。”

  据中科院计算所国家智能计算机研究开发中心主任孙博士介绍,HPCC采用的测试程序并不是新的,系统研制者在评价系统时经常使用,只是没有人拿来作为各个机器对比的基准。不同的应用需要不同的性能,就像体育比赛,通过一个项目给所有运动员排排队是很难的。Linpack就像百米,HPC Challenge就像10项全能,可还有足球、篮球、体操呢?计算所现在更强调面向应用的性能评价。那些基准是厂商们拿来推销自己的,是某个特定配置下的系统的峰值,它告诉用户你永远不能超出这个值,不能告诉用户你的应用能拿到什么值。

  作为中国HPC TOP100排行的制定者之一的中科院软件研究所并行计算实验室张云泉博士认为:“HPCC测试Benchmark从总的方向上来说是对Linpack的一个有用的补充,试图更全面地反映一个高性能系统的各个方面的性能,从而更加综合评价一个系统的性能。是更现实的从应用性能角度看待一个高性能计算系统的有益尝试。但从目前的HPCC软件包来说,个人感觉还是比较零散,其实就是一大堆的测试。这些测试对专家来说也许能够解读出很多有用的信息,但对普通用户来说却不知所云。怎样整合如此多的测试结果,如何让测试简单易行,也是需要解决的问题。

  实际上国内几乎与国际同时也关注这个问题,我们也注意到了国内用户对Linpack的批评。据介绍,张博士一班人马的目标应该说比HPCC更远一些,我们试图提出面向行业的Benchmark,直接解决行业用户的测试需求。

  2005年,数学软件分会会面向全国征集并行FFT测试软件包的方案,并组成专家委员会进行评选,对入选的方案我们会给予一定的资助进行开发和试用。希望《中国计算机报》对此事也给以适当的关注,共同推动这件事情。”

  清华大学计算机系副教授陈文光是国家863“高性能计算机及其核心软件”重大专项课题负责人,他认为HPCC仍有一些局限,其一是HPCC仍然是一个底层的测试标准,目前还缺乏有效的手段来从底层指标准确地预测实际应用程序在系统上的性能;其二是HPCC缺乏对I/O的测量;其三, Linpack流行的原因之一是可以总结出一个分数来进行排序,HPCC现在变成了多个分数,从技术的角度来看是更加精确了,但从对公众和厂商的影响来看可能影响力反而会下降。

  除了上述专家的观点,本报在2004年11月8日的《迎接新一代HPC的挑战》专题中也报道过,聚星公司总裁李晓渝和南开大学计算研究所所长、特聘教授邓越凡提出,衡量HPC时,应该注意的重要指标,包括:性能密度(Performance Density),指在单位空间里达到的运算性能;性能节点比(Performance-Node Ratio),指单位节点所能达到的运算性能,也即以节点数为单位的性能密度;性能能耗比(Performance-Power Ratio),指系统消耗单位电力所能达到的运算性能。此外,再加上学界与业界都熟知的其他传统指标,比如:性能价格比、总节点数量、单位节点价格、峰值运算速率、内联总带宽、总存储空间、单位节点数据吞吐量等,从而构成了衡量下一代超级计算机规模和综合性能的尺度。

  

  ● 相关链接 ●

  什么是HPCC标准

  HPC挑战基准由包括Linpack基准指标在内的7大类28项测评标准组成。7大类具体包括“HPC(1子项)”、“PTRANS(1子项)”、“STREAM(8子项)”、“Random Access(3子项)”、“Latency,Bandwidth(10子项)”、“DGEMM(2子项)”、“FFTE(3子项)”。

  各大类中测评的内容如下:

  HPC:利用与Linpack-HPC相同的线性方程组,测评运算性能

  PTRANS:利用矩阵的转置,测评网络(过程之间)传输性能

  STREAM:对单环境和多重负荷时的内存性能进行测评

  Random Access:对单环境和多重负荷时的内存随机访问(间接访问)性能及过程之间的数据访问性能进行测评

  Latency,Bandwidth:利用过程之间的访问等待时间,测评网络性能,并对节点之间的传输性能(带宽)进行测评

  DGEMM:对单环境及多重负荷时的矩阵积(product of matrices)的运算性能进行测评

  FFTE:对FFT(高速傅立叶变换)的运算性能、单环境、多重负荷时,及总体性能进行测评。

  

  记者手记

  规则变更的背后

  这条新闻猛看上去,似乎是HPC的游戏规则要变了,但从各位专家的话语里面不难体味到,HPC的游戏规则以前就不是完全统一的,现在的评价方式也不是全新的,只不过是关注重点发生了一些转移而已。

  但其中似乎蕴含着一些其他意味。一直以来,我们遵循着别人制定的游戏规则,Linpack也好,HPCC也好,不外如此。但中科院计算所和国家863重大专项的研究表明,我们现在有实力也有信心制定自己的规则,并让别人来参加。而10年来我国HPC产业的高速发展则正是话语权的基础。联想到这些年来国内业界轰轰烈烈发起,又转眼夭折的一些标准和联盟,它们背后所缺少的不正是这样的积累么?