
| 出版日期:2002-12-09 总期号:1175 本年期号:92 |
|
机架式的秘密
宝德PT1300R和PT2300R机架式服务器剖析 陈振智 高密度机架优化式服务器以其小巧紧凑的外型、主流的性能,契合了企业用户IT系统建设“数据集中、高效处理”的趋势。但是,机架式服务器在内部的设计上有其特别的高要求。首先是高可用性。其次,它必须是易管理的。 现在就让我们走近“新一代高密度机架优化式服务器先锋”——宝德PT1300R与PT2300R,一探究竟。 硬盘热插拔 应用问题:当插入新硬盘或拔出一个硬盘时,硬盘可能会被正在工作的电源损坏。 ■解决方案:宝德PT1300r/2300r硬盘热插拔背板使用了电源隔离技术,实现安全的硬盘热插拔。
宝德PT2300r 在PT1300r/2300r硬盘热插拔背板上,每个硬盘接口的电源都分别被独立的电源开关控制。当硬盘背板通过SCSI总线探测到一个硬盘可能存在故障时,这个硬盘的电源将会自动关闭,这时故障硬盘就可安全拔出。当一个新的硬盘插入时,电源控制系统会稍等片刻,待硬盘完全插到位后,再给硬盘上电。当硬盘热插拔背板探测到一个硬盘被拔出时,它将会立即切断这个硬盘槽的电源供应,防止当硬盘只是被局部拔出又重新被插回时对硬盘可能造成的损坏。同时也防止可能的供应电压的下降造成整个硬盘阵列的中断。 PT1300r/2300r的硬盘热插拔背板还支持热备用硬盘的电源控制。再有,当插入一个短路的硬盘或一个硬盘在操作时发生短路时,PT1300r/2300r硬盘热插拔背板还支持电源控制线路的自动旁路,可以防止热插拔SCSI背板被短路硬盘所产生的过大电流损坏。 故障弹性引导 应用问题:一个故障的处理器会使服务器无法引导,导致服务器宕机。 ■解决方案:宝德PT1300r/2300r服务器使用故障弹性引导技术来彻底避免由于一个服务器CPU故障而引起的服务器当机,以保证服务器的高可用性。也就是说如果PT1300r/2300r服务器所配置的第一个CPU在执行引导过程时失败,将会导致系统FRB1计时器超时,并触发FRB1超时事件。这时系统集成的专用服务器管理处理器将会发出命令把第一个CPU屏蔽,并把执行引导任务转交给第二个CPU。如果第二个CPU功能正常,系统仍然可以正常引导。这样即便在系统的一个CPU出现故障的情况下,系统仍可正常引导,实现最大的高可用。 实时散热监控 应用问题:新至强处理器对更高的散热风量的需求将增大机器噪音并会降低风扇寿命。
宝德PT1300r ■解决方案:宝德PT1300r/PT2300r服务器使用领先的实时散热监控技术。集成的专用服务器管理处理器不断实时地从智能前面板、CPU、硬盘热插拔背板及其它关键组件传感器处读取温度信息,将所读取的温度值与存储在主板上的系统管理数据库中的阈值进行比较。如果从某组件所读取的温度值大于数据库中的阈值,负责该组件散热的风扇会根据最低的需求级别自动提速;反之,散热风扇则自动降速,以提供合适的风量。此过程不断重复循环,保证系统在凉快、安静运行的同时,最大程度地延长风扇寿命。 指示灯导向的故障诊断 应用问题:故障组件需要用很长时间来诊断、识别、更换。 ■解决方案:宝德PT1300r/PT2300r服务器使用指示灯导向的故障诊断技术来快速锁定故障组件并快速更换,以实现最小的宕机时间。 集成的专用服务器管理处理器实时监控系统关键组件的状态,并通过各种LED指示灯来表示各组件的健康状况。其中智能前控制面板共有5个不同指示灯可以表示15种不同的状态级别告知管理员机器目前的运行状况及可能潜在的问题;位于机器前面板及机器背后的系统ID识别灯,可以快速定位目标服务器。指示灯可以帮助技术人员快速锁定故障部件如内存槽、风扇、处理器等,并迅速更换。 先进的硬盘固定 应用问题: 高性能、高转速的硬盘会引起更大的硬盘颤动,导至硬盘寿命的减少及性能的降低。 ■解决方案:宝德PT1300r/PT2300r服务器使用机械工程技术来设计硬盘笼子,使用高级铝型材嵌板来作为硬盘笼子的内壁,用来固定硬盘。当硬盘插入时,坚硬的笼子嵌板会阻止硬盘被推出,减少潜在的硬盘颤动。另外所使用的热插拔硬盘拖架采用仅在每个热插拔硬盘拖架的一边使用弹片的设计方案,这样能更好更长久地固定硬盘,避免其颤动。 |
|||||||||||||||||||||||||||