
| 出版日期:2004-05-10 总期号:1311 本年期号:32 |
|
成长型企业专用服务器诞生记
——万全T168的研发历程(之一) 2004年4月13日是一个特别的日子,就在这一天,联想成功发布了全球首款支持热插拔SATA RAID 5功能的单路服务器精品——万全T168。这是一款针对成长型企业打造的单路服务器。 2004年4月13日是一个特别的日子,就在这一天联想成功发布了全球首款支持热插拔SATA RAID 5功能的单路服务器精品万全T168。这是一款针对成长型企业打造的单路服务器。 俗话说:“台上一分钟,台下十年功。”研制这款产品虽然没有“十年磨一剑”,但也凝聚了整个研发项目组九名工程师100多个日日夜夜的心血。尤其是客户的需求,始终牵动着联想万全研发工程师的心。在这些成长型企业的信息化建设中,有基本的局域网,上网以拨号为主(ADSL、ISDN等),他们一般不设置单独的机房,用普通的台式机充当服务器,多种应用集于一台计算机。通常,服务器的应用主要集中在文件和打印服务器、数据库服务器、邮件服务器,典型的网络规模一般为30~100个客户端。成长型企业由于考虑到资金和规模的问题,很少能够拥有专职的网络管理员,他们的服务器技术水平参差不齐,对数据安全没有足够的重视,对数据备份缺乏有效的措施,甚至没有UPS供电,基本依靠公共电网和企业自备发电机直接供电。这种情况下,服务器一旦出现问题,不能得到快速解决,甚至需要公司外部的技术人员支持。如果服务器在关键时刻出现问题,将会给企业带来不小的影响和损失。客户的需求对联想的研发导向是很重要的,针对成长型企业客户的单路服务器开发就显得意义重大了,联想单路服务器精品万全T168应需而生。T168是怎样诞生的? 第一部: 系统设计篇——孕育生命 产品经理给T168的定位是,针对成长型中小企业的一款“高可靠、低成本、高易用”的单路服务器。既要便宜,又要高可靠,还要高易用。这听起来是相互矛盾的,但却是研发人员一直奋斗的目标之一。虽然联想的研发人员对单路服务器的理解已经非常到位,但要真正落实到这样一款单路服务器上还真是极其艰难。但研发工作需要迎难而上,这三个要求必须要落实到位而不是空话或者噱头。 高可靠 服务器的可靠性分两个层面:一是硬件平台的可靠性,二是应用上的可靠性。为了使T168满足“高可靠”的要求,联想的研发工程师决定从这两个方面同时入手:在硬件平台的可靠性上,重点关注电源和主板的可靠性;在应用可靠性上,重点确保数据安全。目标确定了,接下来的就是如何实现了。 电源子系统的设计与开发历来是联想的强项。为了满足系统对电源静态的、动态的及最大的能量需求,工程师们在T168服务器的设计阶段,通过数学模型和算法,精确计算出了系统最大功耗,并留有较大的余量,确保了电源在功耗上的稳健性。同时考虑到单路服务器的用户特点,比如没有专门的机房,没有专用的UPS等设备,同时可能面临极其复杂的电网环境。因此万全T168服务器的电源子系统必须兼容各种电网状况,充分适应各种恶劣的电网环境。在此基础上,联想的工程师们决定采用专用的服务器电源,并结合主板电源系统的独特设计,使得T168能够满足多达30种电网电压及电网谐波失真,适应电网的断电、复电、电压下跌、电压上冲及其他电网不稳现象,并可达到90V~280V无盲点工作。 主板是服务器系统的核心,其可靠性直接决定了整个系统的可靠性。主板设计部门引入了全过程仿真设计,不仅大大缩短了设计周期,而且在主板的稳定性和可靠性上也能完全按照规范来操作。PCB设计是主板设计的基础,在PCB的信号完整性设计时,采用仿真和验证性结合的方法,运用布线策略、地线设计方法以及高频逻辑器件的布线方式等方法,来保证PCB设计的可靠性,从而确保信号的传输可靠性。例如:采用平行的蛇形走线可以减少电感,并尽可能地保持线与线之间的距离防止串扰,同时数字地与模拟地要分离等。 在保障了电源系统和主板可靠性后,下一步要考虑的就是服务器应用级别的可靠性设计了。对于用户来说,可靠性的一个直接感受就是数据安全、系统稳定运行不宕机。怎样才能保证这一点?研发工程师把目光瞄向了中高端服务器才有的RAID 5功能。RAID 5的最大特点就是在确保数据安全的同时还能保持很高的磁盘子系统读写性能,并且其安全级别也是最高的。好东西自然价格不菲,长期以来RAID 5技术只应用在中高端服务器的SCSI RAID上。SCSI RAID 控制器再加上SCSI 硬盘的昂贵价格,使得对价格极其敏感的单路服务器只能望而却步。难道低端单路服务器就没有福气享用高技术?要不要上RAID 5成了争论的焦点。有人认为,在万元级别的单路服务器上用RAID 5根本就是痴人说梦;也有人认为,要做就做到最好,一定要上RAID 5。在进行了技术可行性分析后,结论是,在T168上实现RAID 5是完全可能的。联想决定采用这种技术。 高易用 为了配合RAID 5技术的采用,并结合“高易用”这一要求。研发工程师决定一不做二不休,干脆把“硬盘热插拔”这一同样是中高端的技术也一并应用到T168上。 “RAID 5+硬盘热插拔”让这些研发人员兴奋不已。 要想易用,当然还缺不了联想全系列的服务器所采用的具有强大功能的导航软件,它具有“无人值守”自动安装操作系统、数据备份与恢复等功能。值得一提的是,T168导航软件的备份和恢复技术可以跨操作系统和文件格式,支持Windows、Linux、Unix、Netware等主流操作系统下的数据备份与恢复。T168所拥有的热插拔RAID 5和导航软件的备份恢复功能,为用户的数据安全实现了双保险。 低成本 RAID 5、热插拔、可靠性电源系统、导航软件,再加上电磁辐射超过国家标准达到Class B级的要求(A级为工业标准,B级为消费品标准,是民用的),看起来,这样一款服务器是难以实现低成本的。为了让用户在享受高端应用的同时只付出低端应用的成本,就必须深刻理解相关技术并完全加以掌控。在RAID 5上采用的是SATA RAID而不是SCSI RAID,这样在成本上降低了很多,但在性能和可靠性上并不差。在实现热插拔上没有采用惯用的一体式硬盘模组,而是采用了热插拔背板加固定的硬盘仓这种组合的方式。这不仅降低了成本,还可以同时支持热插拔硬盘和非热插拔硬盘两种配置,更值得肯定的是,把可支持的硬盘数量从4个扩充到了6个。这既降低了成本又提供了扩展性,还保证了易用性和可靠性。 “动嘴容易,动手难”,系统设计只是提出了想法和总体架构,虽然说经过了数学建模、仿真设计、图纸设计、设计验证等环节,并应用了一些理论上的东西,但这时的T168还只是停留在“意识形态”上。只有完成了主板、电源、机箱、热插拔背板、RAID 5 控制器这些关键的部件开发工作,才能说八字有了一撇。下期就要说这些关键部件的开发。请关注下篇部件开发——嗷嗷待哺。
联想万全T168服务器
实验室里的临时会议
工程师正在进行验证测试 |
|||||||||||||||||||||