博通资深副总裁暨核心交换器部门总经理 Ram Velaga 表示,机器学习需要将大量 GPU、CPU 或客制化晶片互相连结,如同单一大型运算系统。传统上,垂直扩充(Scale-up)依赖 NVLink 等专有技术,但受限於单一伺服器或机架规模;水平扩充(Scale-out)则需跨机架甚至跨资料中心连结,对延迟要求极高,Broadcom 的 Tomahawk Ultra 交换器可将延迟压低至 400ns,刷新业界纪录。
他指出,辉达 NVLink 与 InfiniBand 属于封闭专有技术,授权受制于该公司,甚至可能要求连接自家交换器或 GPU。Broadcom 则采开放策略,将以太网路连接 XPU 的完整规格公开,允许任何厂商使用任何乙太网交换器进行 Scale-out,并已推动 Meta、AWS 等云端业者将大型 GPU 丛集由 InfiniBand 转向 Ethernet 架构。
Jericho4 采台积电 3 奈米制程、内建 4 颗 HBM,支援跨距离 100 公里以上的资料中心互连,并具深度缓存与壅塞控制,确保长距离 RoCE 无损传输。单一系统可扩展至 36,000 个 HyperPort,每个传输速度 3.2Tb/s,并支援全线速 MACsec 加密,提升安全性与效能,可将不同地点的小型资料中心串接成单一运算资源池,突破电力与空间限制。
Ram Velaga总结,网路是分散式运算的核心,而 Ethernet 是最佳互连技术。开放标准能让最佳网路与最佳 GPU 在同一市场公平竞争,避免因封闭式专有网路导致的技术封锁,让最好的网路产品胜出,也让最好的 GPU可以获得市场青睐,而不该将 GPU 绑定在专有网路上限制市场竞争。
