博通公司宣布已交付StrataXGS®战斧®5交换机系列,在单个单片设备中提供51.2太比特/秒的以太网交换容量,是当今市场上任何其他交换机硅的两倍带宽。

博通核心交换集团高级副总裁兼总经理Ram Velaga表示:“在我们发布业界首款25 Tbps交换机战斧4两年后,交付了全球首款51.2 Tbps交换机,这证明了博通团队出色的执行力和创新能力。”“自2014年推出战斧1号以来,博通一直在执行大约每两年将带宽翻一番的目标。随着今天第五代战斧家族的推出,我们很自豪地说,一个战斧5取代了网络中的48个战斧1交换机,从而减少了95%以上的功率需求。我们赞赏我们的客户、合作伙伴和工程师使这一切成为可能。”

虽然数据中心的网络带宽需求持续急剧增长,但也有强烈的动机将通用计算和存储的网络基础设施与AI/ML计算的网络基础设施统一起来。AI/ML训练集群正在推动对具有高带宽连接、高基数和较低作业完成时间的结构的需求,同时在高网络利用率下运行。

以太网为统一的网络基础设施提供了最佳的解决方案,它提供最低的功耗、最高的带宽、最高的基数和最快的SerDes速度,并且每18到24个月可预测地将带宽翻一番。这些优势与其庞大而充满活力的生态系统相结合,为AI/ML和云规模基础设施提供了每瓦和每美元的最高性能互连。

为了实现下一代统一网络,Broadcom现在提供Tomahawk 5系列。对于在大型数据中心中高效使用大规模共享基础设施至关重要,Tomahawk 5提供AI/ML工作负载虚拟化功能,如单通道VxLAN路由和桥接。对于最小化AI/ML工作负载的作业完成时间(JCT)至关重要的是,Tomahawk 5提供了Broadcom认知路由、高级共享数据包缓冲、可编程带内遥测和基于硬件的链路故障转移等功能。

战斧5的认知路由通过自动和动态地为穿越交换机的每个流选择系统中负载最轻的链路来提高网络链路利用率。这对于AI/ML工作负载尤其重要,因为这些工作负载通常结合了短期的老鼠流和长期的、低熵的高带宽大象流。战斧5包括实时动态负载平衡,跟踪交换机和网络下游所有链路的利用率,以确定每个流的最佳路径。它还监视硬件中链接的健康状况,并自动引导流量远离故障链接。这些特性极大地提高了网络利用率,减少了拥塞,从而缩短了JCT。

改进JCT的另一个重要方面是通过控制每个源注入网络的流量速率来最小化网络拥塞。由于网络运营商在其端点(如商业或自定义网卡)采用各种不同的拥塞控制算法,因此战斧5在实时流量和网络探针上提供了广泛的可编程带内遥测。实时元数据可以在流量遍历网络时以线路速率插入到流量中,以收集有关队列大小、数据包延迟、交换机利用率和各种其他客户可选择指标的遥测数据。此元数据可用于精确的端到端网络拥塞控制。

为了实现最低功耗和最低成本的物理连接,战斧5支持直接100G PAM4接口,可直接连接铜(DAC),前面板可插拔光学器件和共封装光学器件。灵活的,长到达Tomahawk 5 SerDes提供DAC连接到机架内的所有设备,甚至机架之间,而不需要计时器或其他活动组件。它还可以直接连接到广泛的标准前面板可插拔光模块生态系统。

此外,利用博通领先的硅光子学和封装技术,战斧5将使用博通的硅光子学封装小芯片(SCIP)平台进行共封装光学器件,从而将光连接所需的功率降低50%以上。由于相同的交换机芯片提供了所有这些选项,因此客户可以为其集群内、集群间和数据中心间网络的每个部分选择最佳I/O,而无需进行软件移植。

StrataXGS战斧5系列主要优点:

  • 支持下一代统一数据中心基础设施,64端口800GbE交换和路由。
  • 通过单通道VxLAN路由和桥接实现一般计算和AI/ML工作负载的虚拟化。
  • 无与伦比的物理I/O选项,使用512个业界性能最高、最灵活、寿命最长的100G PAM4服务器实例。
  • 高精度PTP和SyncE时间同步。
  • 六个片上ARM处理器,用于高带宽,完全可编程的流遥测和复杂的嵌入式应用,如片上统计汇总。
  • 无与伦比的功率效率,实现为单片5nm芯片。

Wheeler 's network首席分析师Bob Wheeler表示:“尾部延迟是分布式AI/ML训练的关键网络性能指标。“Broadcom认识到传统的基于哈希的负载平衡对这些工作负载的局限性,并在Tomahawk 5中添加了带有动态流导向的认知路由。超大规模运营商现在可以统一他们的网络结构,消除专门用于培训集群的专用互连。”

与一般的计算和存储相比,AI/ML训练集群具有独特的通信模式。为了最小化JCT, Tomahawk 5为这些工作负载和网络拓扑添加了特定的特性。

StrataXGS战斧5系列AI/ML主要特点:

  • 世界上最高的200GbE端口基数:单个芯片上支持256个端口,实现扁平,低延迟的AI/ML集群。
  • 业界最先进的51.2 Tbps共享缓冲架构,为RoCEv2和其他RDMA协议提供最高性能和最低尾部延迟。
  • 先进的Broadcom认知路由,动态负载平衡,并支持端到端拥塞控制功能,专门用于处理AI/ML工作负载典型的大型低熵流。
  • 支持Clos和非Clos拓扑,如torus、Dragonfly、Dragonfly+和Megafly。
  • 基于硬件的链路故障转移,提高网络弹性,减少JCT。

与Trident和Jericho交换机家族一样,战斧系列是博通三管齐下战略的一部分,旨在为不同的网络应用提供优化的交换机架构。所有这些设备都共享一个通用的编程接口,因此客户可以轻松地在不同的平台上利用他们的软件开发工作。

博通坚定地致力于开放网络,为所有五代战斧家族提供了交换机抽象接口(SAI)和博通SDK开放api。博通是SAI和SONiC网络操作系统的最大贡献者之一。为了加快部署时间,战斧5芯片上提供了对SAI和Broadcom SDK的支持,以及一套全面的网络和设备仿真工具。

Broadcom Tomahawk 5 BCM78900已于今日面向全球客户推出。有关战斧5的更多信息,请点击在这里