ccidnet????

出版日期:2003-03-24 总期号:1200 本年期号:19

本期导读
要闻综合
中国信息化
网络与通信
软件与服务
藏典
渠道与市场
20年的信赖专刊
东北专刊
华东专刊
华南专刊
西北专刊
西南专刊
曙光“拆房子”
曙光4000L实现高性能计算技术的突破
童铭

  技术创新有几条路可以走,按照国家智能计算机研究开发中心主任孙凝晖的话说,一条路是“开天窗“(技术增值),第二条路是“打地洞”(集成创新,产业驱动),这两条路都是在原有的技术不可改变的基础上;而第三条路则是“拆房子”(突破性创新)。曙光4000L的推出,就是在力图推翻原有的技术,重新“盖房子”。

  相比曙光系列产品的发布,曙光4000L的发布活动可能有些简单。今年3月14日,曙光公司与中国科学院计算机技术研究所国家智能计算机研究开发中心联合推出曙光4000L,在中科院计算机所二楼相邻的两间会议室,其一是曙光4000L验收会现场,另一间则是新闻发布会现场,而会议活动的主角—曙光4000L就静静地卧在会场的楼下。


  验收专家在参观曙光4000L高性能计算机

  中科院计算机所所长李国杰院士说,发布会形式的简单,并不是说明曙光4000L通过验收这件事情不重要。的确,在曙光4000L的身上,我们看到了中科院计算机所和曙光公司对高性能计算机发展的思考,包括技术路线和技术实施,同时也看到了国产高性能计算机将会拥有更大的市场。


  HPC=高生产率计算


  还是让我们先来看看高性能计算的现状,这有助于了解曙光4000L的推出所体现的突破的意义。

  曾经,高性能计算性能的重要指标是峰值速度。这是因为高性能计算很难衡量,而系统的时钟频率和每秒执行指令的数目是实现各类计算的基础,因此峰值速度是衡量各类性能并易于测试的基准之一。但是随着用户需求的发展,情况发生了很大的变化。这些需求体现在从信息处理发展到获取知识,直接由需求者使用计算机环境、协同计算和主动服务、和谐人机环境和信息保障等。同时,需求的变化也带来支持技术的发展,需要诸如MPP、网络、面向对象、多媒体和可视化计算等技术支持。

  在2001年2月曙光3000的成果鉴定会上,中科院院士汪成为直言:高性能计算的发展是有规律可循的。


  呈“U”字型的曙光4000L高性能计算机

  曙光4000L项目负责人孙凝晖结合高性能计算发展现状,对这一论述进行了阐述。他认为,在cluster时代,是三角形技术路线,从CPU、内存、互连网络,一直到通信、并行算法等,目标是解决一个系统纯科学计算密集型应用,这是一个单一的目标。而从2002年至今,被孙凝晖称为“后cluster”时代,在这一阶段,高性能计算机系统的门槛越来越低,这是因为核心技术出现了大规模生产,导致出现了商品化、标准化的趋势,甚至出现了用户自己动手组建高性能计算系统的情况。同时,随着网格时代的逐渐来临,单一面向计算密集型应用这一目标已不能满足用户的新需求,这就需要出现创新的技术。

  这些新需要是什么?我们可以看到,主要体现在数据密集、网格计算、高端行业具体应用等。孙凝晖认为,高性能计算的下一个时代将是网格(Grid)时代,将会出现放射状技术路线,从核心技术(CPU、主板、互联网络)向数据密集处理、数据密集计算、应用服务、网格等多个目标方向发展。

  孙凝晖说,高性能计算(High Performance Computing)应当变为高生产率计算(High Productivity Computing),应当根据用户的需求进行变化。


  先有蛋后有鸡


  曙光4000L的推出,正是符合孙凝晖所阐述的技术路线。曙光4000L的研制,是完全面向用户的需求,针对数据密集处理进行技术创新。

  换句话说,是先有了用户的应用需求(蛋),才有了曙光4000L的研制(鸡)。这其实不难想像,一套价值几千万元的系统,如果纯是为了填补科学空白,将会延长产品市场化的时间。曙光4000L充分体现了中科院计算所在科研成果市场化方面的运作能力。

  本次验收是针对实际应用进行的,而曙光4000L这套系统就是针对国家信息化的实际应用而设计的,要满足数据密集型应用的需求。中科院计算所不只是在研究“高、精、尖”,填补技术上的空白,而且还填补了市场及应用上的空白,把科研和市场、应用紧紧地结合在一起了。数据密集型处理,这是一个需求非常大的市场,在金融、电信、石油等领域有着极大的市场潜力。

  当面向数据密集型处理的具体应用时,原有的高性能计算机无法满足很多需求,比如支持网络、在线扩展、数据密集、全线监控、安全管理和Internet数据处理及性能评价等。而这些方面的需求,也正是曙光4000L在技术上所实现的突破点。可以说,用户的实际应用需求,带来了曙光4000L在数据密集型处理上的技术突破。

  从2001年曙光3000完成后,中科院计算所和曙光公司就开始了曙光4000L的研制,2002年设立了计算所知识创新工程项目“曙光4000L超级服务器”,于2002年11月开始工程实施,并在2003年3月通过验收。

  从测试结果来看,曙光4000L在运行海量数据处理应用方面表现十分出色:进行并行数据库操作时,每天能处理163亿次以上入库操作,86亿次以上数据库混合操作,进行百万记录表规模的数据挖掘的平均响应时间为2.5秒。形象地说,一台曙光4000L有能力实现存储4000万网民每人每天进行200次短信操作的全部内容;在进行Internet数据处理时,单节点的接入能力为每秒65万数据包,系统能够满足32Gbps的实时数据流的并发接入要求,系统的数据特征扫描能力为平均每节点400Mbps,能满足中国电信的Internet骨干网数据业务的数据接入和数据处理的要求。

  基于这种强大的综合数据处理能力,曙光4000L被专家称为中国高性能计算机的“航空母舰”。


  “U”型的“航母”


  在中科院计算所一楼系统组装现场,曙光4000L系统摆成了一个“U”字型,我们见过“一”字型和“H”字型的高性能计算机,曙光4000L为什么是这样一个形状呢?孙凝晖解释说,我个人比较喜欢数学,在26个英文字母中,“U”的体态最优美,长和宽是一个黄金分割。

  看来,孙凝晖根据自己的美学观点搭建了曙光4000L高性能计算机机群系统,这艘“航母”同时也搭载了无数的技术创新。

  孙凝晖说,把曙光4000L称为“航母”,是因为在这样一个平台上乘载了很多关键技术。这其中包括强劲的动力系统——机群系统技术,舰载机、巡航导弹——数据密集技术,对舰队的指挥能力——网格零件,续行能力——在线扩展技术。

  这些技术使得曙光4000L这艘“航母”能够顺利航行。同时,孙凝晖还在曙光4000L中进行了一些小尝试。做了多年的大规模计算机机群,他认为,机群将计算机的“劣根”放大了许多,比如资源的命名空间问题、散热问题、论证问题等。像曙光4000L内部,有3342个风扇,最多可以达到7000个,如何能够把风扇的数量减少,同时又不影响散热的能力?这都是孙凝晖在考虑的问题。

  曙光4000L的技术创新点很多,其技术路线主要体现在面向数据密集应用、网格技术、应用专用技术、技术共享四个方面。曙光4000L的研制共产生了52篇学术文章、9篇博士论文、24篇硕士论文,以及多项发明专利。

  应当说,曙光4000L这艘“航母”不仅摆放得时尚、唯美,而且在科研成果市场化、学术研究、社会效益和经济效益等多方面都实现了完美的结合。这一点也正是中科院计算所和曙光公司一直在追求的目标。

  继曙光4000L后,中科院计算所与曙光公司还将陆续推出曙光4000A、曙光4000H和网格服务器,在高性能计算上的产品规划一直做到了2006年。而每一个产品都是市场与科研的结合,每一个产品都是面对市场特定的需求。李国杰院士说,下一步,中科院计算所与曙光公司将研制曙光4000A。这一产品将面向科学计算,具有更强的科学计算能力。曙光4000L的推出,让我们看到“盖新房子”不只是技术上的突破,同时也是市场和应用的突破。