
| 出版日期:2004-11-29 总期号:1368 本年期号:89 |
|
竖起计算领地新地标
李永胜 曙光4000A作为上海超级计算中心二期工程的开通,不仅仅意味着国家网格最大的主节点增强了计算能力,中国首次迈进了10万亿次计算应用的新领域,同时也意味着上海超级计算中心开创了一个社会超级计算资源运营的新模式。至此,我国在科研、公共事业和企业计算方面都进入了一个新的时代。
启动仪式的大门即将打开 身边的超级计算 对于甘肃天水自来水开关厂的王厂长来说,悬了三个月的一块心病终于落地——最大的一个客户终于不再要求退货了。 最近新设计生产的一批工业用自来水水阀,样品刚刚交货几天就被客户指认为不合格,原因是噪音太大,达到了100多分贝,使得客户实在难以忍受,提出退货。技术科的人员告诉厂长,听说上海超级计算中心可以解决很多流体力学方面的问题,可以前去一试。 厂长和技术科的人抱着试试看的态度找到了上海超级计算中心的工程技术人员,说明来意。上海超级计算中心的傅文彪主任把这当作一个项目来接,并组织人员和超级计算机的计算资源,经过三个月的动态仿真模拟和动态耦合,找出了阀门设计方面的缺陷,发现出现这样超常噪音的原因很复杂,有机械、电磁、声学等多方面的原因,并提出了三个解决方案以降低噪音。其中一个方案效果最佳,把噪音降低到了75分贝以下,满足了用户的要求。同时,通过计算还发现了另外一个问题,就是阀门的不对称设计问题,这也给阀门厂的后期设计提供了帮助。 这让王厂长看到了超级计算机其实离大众生活并不远,其实更应该说时时刻刻都在身边,如天气预报、城市环保和容灾、汽车设计、立交桥和隧道设计等。 这是上海超级计算中心王普勇副主任给记者讲述的一个故事。事实上,上海的超级计算中心二期工程的启用,也迎来了一大批科研、公共事业和商业客户。在曙光4000A启用的当天,就承接了11项应用课题,其中包括上海市气象局、中科院上海分院、复旦大学、宝钢集团、上汽集团、上海飞机研究所等多个单位的计算任务。
中科院院士李国杰认为曙光4000A实现了科研和应用的双跨越。 不仅是技术的胜利 曙光从事高性能计算研制、生产的10年,也正是中国高性能计算机产业化的10年。 自启动“10万亿次超级计算机”计划以来,曙光4000A的研究和应用的进展便一直受到业界的广泛关注。而“中国需不需要10万亿次的计算机”则成为当时国内外广泛关注的话题,其中的潜台词是对中国高性能计算机能力和水平的疑虑。 一直从事超级计算机研发的中科院李国杰院士对中国在超级计算机方面的“屈辱史”记忆犹新。他回忆说,以前,中国从国外购买超级计算机后,对方还要加上“派公司技术人员到机房内进行监控”等条件,甚至指定哪些计算任务能做,哪些计算任务不能做。而现在,在超级计算的很多领域,我国都实现了自主研发,拥有了超级计算机方面的知识产权,完全有能力说“不”。李国杰说,比较起来,我国自己研制生产的高性能计算机性价比、稳定性等都高于国外同类机器。 据上海超级计算中心副主任奚自立介绍,曙光4000A运到上海超级计算中心后,只用了10天时间就完成整个系统的安装调试,实现了正常运行。在最近两个月的试算与应用软件测试移植过程中,几百个节点没有换一块主板,系统的可靠性、稳定性超出了上海超级计算中心的预料,甚至也超出了曙光人的预料。 业界超级计算机专家认为,参照最近刚刚发布的2004年我国高性能计算机TOP20排行榜,和国外的超级计算机巨头相比,我国的超级计算机全部是机群系统,这是一个局限;但值得关注的是, 我国在超级计算机整体性能的提升上已经取得了长足的进步。 曙光总裁历军印证了这一观点,如果曙光只是简单地把PC服务器堆积起来,而不注重系统级的创新,曙光将无法前进而只会在原地踏步。在过去十几年研制生产曙光系列超级服务器技术积累的基础上,曙光4000A在系统的可扩展性、可管理性、可用性、易用性等方面做了大量独创性的工作。其中超级计算机主板和2U 4路处理节点都是自己设计的,这比国外对手的计算密度提高了一倍,这种领先国外大公司的主板已经销往包括美国在内的多个国家。作为面向网格的超级计算机,曙光4000A也率先设计使用了网格路由器、网格网关、网格监控和网格操作系统,为上海超算中心成为我国国家网格名副其实的主机中心做了大量技术上的突破。 对业界来说,曙光4000A的开通使得中国商品化高性能计算机最终实现了对10万亿次大关的突破,更实现了应用上的大踏步的跨越,而不仅仅是研发。 2002年曙光公司、上海超算双方就超级计算机展开接触,根据上海超算的应用需求,曙光在技术研发方面做了相关技术准备。而根据国家和上海市的具体需要的预测,上海超级计算中心最终确定了10万亿次的计算需求总量。 当年年底,曙光拿出4000A的方案与上海超算展开全面沟通,根据对计划进展的规划,曙光在2003年7月启动“红色网格”项目研发计划,双方合作开发。值得一提的是,在研发阶段,上海超级计算中心也就可管理性以及个别应用的特殊性对曙光提出了具体的要求,真正实现了需求推动。 据上海超级计算中心的工程师介绍,在交付正式使用之前的试运算阶段,曙光在超大规模计算机群设计、部署、操作系统、管理软件、应用软件移植、优化方面的能力已经得到了充分的验证,根据评估的结果,曙光在系统成本控制、运行能耗、硬件损耗方面也做到了全球领先。 第三方计算新模式 截至目前,曙光4000A试运行阶段,也实现了近30个重要的商用应用和科学计算软件的运行,获得了良好的应用性能,大大提高了上海地区的汽车、飞机、船舶等制造行业的设计能力,也已成功运行了天气预报、石油地震资料处理、流体力学计算、基因与蛋白分析和材料科学等领域的30多项应用,表现出强大的科学计算、事务处理和信息服务能力。 对于长期在科研一线的曙光技术工作人员来说,他们的成果终于走出神秘的科研院所,面向社会,应用于社会经济的各个领域,但对他们来说,这远远超出了技术本身。 成立于2000年12月的上海超级计算中心,是2000年上海市一号工程——上海信息港的主题工程之一,同时也以国家网格南方主节点的规格来规划,也因为曙光4000A的启用相当于获得了类似三峡大坝在我国电力资源的地位,在作为国家资源服务于科研和教育等多个领域外,也正在向商业应用拓展,并开创第三方公共计算平台的服务模式。相比全国其他八个高性能计算中心,上海超算并不隶属于某一个行业或企业机构,在将来的计算资源分配上,有更大的灵活度为社会和企业用户提供解决方案。 在上海超算的规划中,在达到了上海“科教兴市”的区域战略目标以后,上海超级计算中心正努力向国家级别的研发公共服务平台迈进,这将是一个长期的目标。
上海超级计算机中心承接着来自各行业的计算任务 未来任重而道远 刚刚参加第24届国际超级计算机大会回来的李国杰深有感触,一方面是国际上对中国高性能计算机的开发应用能力增长的重视,另一方面是国外高性能计算机正在飞速发展, Linpack评测标准明年将被新的HPC Challenge取代,对于已经取得阶段性成果的曙光来说,局势也不乐观。 但在李国杰看来,中国科学院计算所依然任重道远。他认为,在过去几十年间,计算机的性能每年平均增长80%,其中芯片进步只占20%,主要来自系统层面的进步,占50%,而应用占30%。在863计划和科学院知识创新工程的支持下,计算所正研制用于高性能计算机的通用CPU芯片。今年年底以前500MHz主频的龙芯-2C性能要超过中档奔3,可用于桌面PC机。明年年底左右,1GHz主频以上的龙芯-2D性能将超过2GHz主频的奔4,可用于构造万亿次超级计算机。 他同时分析,我国在超级计算机方面与国外最大的差距在应用上。而从技术层面,中国的超级计算机技术已经开始迈进国际的先进行列,坦率地讲,在近几年内,全世界任何一家公司还做不到随手来一个微机程序,就能加载到像曙光这样的万亿次的并行机中,一点工作都不做就能自动在并行机上运行,但是,曙光4000A最终实现了这点,这为用户在曙光4000A上完成各类大型商业应用提供了可能。在刚刚完成不久的国家中长期科技发展战略研究报告中,中科院已建议把高性能计算机的战略性应用作为我国发展信息技术的重要任务之一,这是专门为国内其他高性能计算机在应用移植方面的不足而提出的。 曙光技术副总裁聂华认为,在未来一个重要的趋势是,标准化产品和标准化构建方式的不断引入降低了高端服务器的门槛,同时也对使用专用技术设计的传统高端产品发出挑战,技术设限所能起到的对竞争的屏蔽作用,越来越受到由用户层发起推动的通用性、好用性等需求的挑战和质疑。超级计算机的发展正从传统的领先技术推动方式向以市场导向的用户应用需求拉动方式转化,这也正是包括曙光在内的国产超级计算机厂商的努力方向。 背景资料中国国家网格:中国国家网格专项由国家863高技术研究发展计划资助,旨在建立面向企业、高等院校、科研机构、政府部门的国家高性能计算环境。主节点采用自行研制的、面向网格的高性能计算机。若干工业、服务业、科学研究以及资源环境领域的网格应用投入运行,实现资源共享、协同工作。专项的主要任务包括: · 建设中国国家网格实验床CNGrid; · 建立具有4万亿次以上计算能力的网格主节点; · 支持网格应用以及维护网格系统运行的网格软件; · 开发具有代表性的网格生产性应用。 其中,南北两个网格主节点为:中科院网络中心(北京)和上海超级计算中心(上海)。 记者手记TOP排名之外的意义 今年无疑可以说是曙光的“名誉年”——“HPC全球TOP500排名第十”、“HPC中国TOP100排名第一”,这是长期技术积累和研发投入的结果,也是国内同行短时间内不可企及的成就。 值得注意的是,曙光公司正在发生着一个悄悄的改变——高端服务器产品设计方面导向性改变。例如,除非用户正式要求,曙光高端服务器产品今后不寻求或不苛求在国际“TOP500”、国内“TOP100”等基于各类理想化测试模型的排名的名次,也不会在市场宣传上渲染“硬件层次”的平台概念或“指标”,而以更好地解决用户实际需求中遇到的问题作为第一要务,围绕实际应用展开核心技术研究,以为用户使用高端服务器产品给用户带来真正的、实在的效益作为今后产品工作的重点。 事实上,并非技术上的突破不合时宜,而是关注现实的务实应用更有效。 关于科学与应用的辨证关系是,应用需求的发展和科学技术的进步是螺旋地上升,技术的突破能引发更多的应用需求,而应用的需求一直是技术创新的源头,双方相互促进、相互作用,而曙光在中石油、国家气象局等领域的大型应用正说明了这点。随着这些应用领域的不断发展,将有更多的需求和方向涌现出来,这又成为技术创新的原动力。这也正是曙光TOP排名之外的意义。 |
|||||||||||||||||||||||