
| 出版日期:2003-09-15 总期号:1250 本年期号:69 |
|
万兆也有瓶颈
港湾公司供稿 随着宽带技术的不断发展,用户对Internet互连的核心设备——路由器的性能提出了越来越高的要求,传统的基于总线和中央处理器结构的路由器由于其体系结构上的局限,已经无法满足组建高速主干网络的需求。尤其是近两年国内宽带接入应用的普及,仅在2003年上半年,中国电信就部署了600万线的ADSL,这个数据超过了以往部署的所有ADSL用户数的总和,并且中国电信还计划在下半年部署300-400万线的ADSL,从而导致了各大电信运营商IP城域网建设高潮的到来;与此同时,各个省都在大力进行电子政务网建设,各大重点城市都专门新辟出一块土地兴建“大学城”,即把市内各个高校集中建设在一起,形成一个集教学、科研、试验于一体的高科技产业园区,以响应国家的“信息化带动工业化”的要求。这一切都说明万兆路由器走向规模应用已经是一个必然。 万兆路由器由于其大容量数据交换的需求,必须在以下几个技术方面取得突破:大容量线速交换技术、交换容量可扩展技术、快速路由查找技术、高速交换下对不同业务的QoS保障技术。港湾网络经过近三年的潜心研究,发布了基于万兆平台的高端核心路由器——PowerHammer P640/320/160,其交换容量分别达到了惊人的640G和320G、160G,目前同时可以提供16/8/4个万兆接口。PowerHammer路由器最近在信息产业部泰尔实验室顺利通过了入网测试,尤其值得一提的是其10G端口对40字节的数据报文的转发达到了业界极难达到的线速转发。之所以能够达到这样的转发性能,是因为港湾网络的核心路由器在大容量交换、可扩展性、高速路由查找、QoS保障等方面取得了一系列技术突破,本文就这几个方面做一个简单的介绍。 PPS+CIOQ结构 实现交换容量平滑扩充 从路由器诞生之日起,对路由器的高效路由转发的研究就从来没有停止过,路由器的结构也从传统的SM(共享内存/总线)结构到现在的交换结构,(Switch Fabric)提高各接口单元之间的数据通信速度是真基本思想。因此现在的高端核心路由器都采用了中央处理单元加单独交换网板的结构。中央处理单元目前主要采用基于ASIC的芯片,在2.5G以下的较低速率的设备中,也有一些厂商的设备采用了NP(网络处理器)甚至RISC的CPU来作中央处理单元,但由于万兆应用在处理延迟和容量方面的要求,目前可以商用的基于万兆平台的路由器全部都采用了ASIC芯片作为中央处理单元。在交换结构体系中,按照调度算法的不同又有IQ(输入队列)、PPS(并行包交换)、Multistage(多级级联)、CIOQ(组合输入输出队列)等结构。 港湾网络的PowerHammer P640/320/160核心路由器采用了可扩展的全分布式交换架构,即除了主控板上的中央处理单元之外,每个接口板上也具备单独的中央处理单元,然后和交换网板连接,形成一个PPS+CIOQ的结构,即在接口板上采用PPS结构形成很强的扩展性,通过芯片的叠加可以支持将来的OC-768(40G接口),而在交换网板上采用了目前比较先进的CIOQ结构保证了大容量交换下对组播等业务的支持,从而突破了CIOQ的扩展性问题和PPS的组播支持问题。在这种结构下,只需要增加交换网板的容量或者数量就可以迅速扩展整机的交换容量,在接口板上增加交换芯片就可以扩展每个接口板的端口容量,从而同时突破了性能和扩展性的瓶颈,整机的交换容量达到了世界领先的640G/320G/160G,整机转发能力也达到了400Mpps(PowerHammer P640)以上。 FPGA+ASIC同时突破 性能和灵活性瓶颈 在PowerHammer P640/320/160核心路由器的每一块接口板上,有四片港湾网络自主研发的10G ASIC芯片——RACATA,单片RACATA具备对40字节的数据报文44Mpps超强转发能力,单片支持双向10Gbps线速转发最小40字节报文的能力。每板四片可以支持双向40Gbps的转发能力。由于ASIC芯片由于其固化的不可编程的特点,虽然带来了极高的性能,但却有灵活性差的缺点。PowerHammer P640/320/160的FPGA(现场可编程门阵列)+ASIC的结构彻底解决灵活性和性能之间的矛盾。
P640接口板技术架构:ASIC+FPGA 如上图所示,通过可以二次编程的FPGA芯片,实现对将来各种功能的扩充,同时又帮助ASIC芯片解决了灵活性的问题,做到对MPLS、各种表查找算法和QoS队列技术等功能的支持。 FPGA+TCAM 实现每秒亿次路由查找 TCAM是Ternary Content-Addressable Memory的缩写,意为三重内容可编址存储器,是近年来在各种高端设备上逐渐大量使用的一种技术。TCAM采用了并行查找技术,使查找速度和表项的条目数量无关,无论条目数量有多大,都可以一次命中,从而实现了高效的路由表以及各种策略表项的查找。PowerHammer P640/320/160所采用的TCAM可以实现每秒上亿次的查找,完全满足10端口线速转发查找各种表项的需求。并且表项最长可以达到288比特,所以有很强的扩展性,可以同时用来实现ACL、QoS、IPv6的表项查找以及用户、业务或者协议栈特定的多级查找链。为了实现高速的查找,在TCAM中要按照IP地址前缀的长度由长到短顺序排列各类表项,因此在表项数量很大的情况下,如果出现频繁变动,将会引起比较大的计算量。港湾网络的PowerHammer P640/320/160通过FPGA和TCAM配合,实现各种表项的空间预留和排列计算,实现TCAM的高速查找和ASIC芯片的高速转发之间的协作,最终实现了路由表在100多万条的情况下,每秒上亿次的查找速度。 |
|||||||||||||||||||||||||||||