今天分享的是:2025年ETH-X Scale Up 协议测试报告
报告共计:39页
ETH-X Scale Up协议测试完成:AI算力互联再突破,低时延高吞吐满足大规模训练需求
随着人工智能模型向更大规模、更复杂架构演进,计算集群内部的互联性能已成为制约AI效率提升的关键瓶颈。近日,开放数据中心委员会(ODCC)发布《ETH-X Scale Up协议测试报告》,通过完整的原型验证,证实了ETH-X Scale Up协议在高吞吐、低时延互联领域的技术优势,为AI大规模训练与推理场景提供了新的技术支撑。
此次测试围绕ETH-X Scale Up协议(PAXI+PRI)展开,以当前数据中心广泛应用的RoCEv2协议作为性能基线,从组网连通性、转发性能、Direct Access性能、Direct Copy性能及MOE通信性能五大维度,全面验证协议在AI算力互联场景下的可行性与先进性。测试环境采用1台高性能以太交换机(整机容量51.2T,支持128个400G端口)与4台合见工软原型验证平台组成组网,模拟真实AI计算集群的互联架构,确保测试结果具备工程参考价值。
在基础组网连通性测试中,ETH-X协议展现出稳定的互联互通能力。无论是基于RoCEv2协议的端到端报文收发,还是ETH-X专属的PAXI报文读写操作,均能实现数据的准确传输。测试结果显示,主机间通过PAXI协议可顺利完成4KB数据写入与128B数据读取,且交换机转发无错误统计,为后续性能测试奠定了可靠的连接基础。这种全栈互联协议设计,覆盖物理层、数据链路层与事务层,能够直接适配GPU等算力引擎的高效数据访问需求,避免传统协议多层转换带来的性能损耗。
转发时延是衡量算力互联效率的核心指标之一,尤其在AI同步计算场景中,端到端时延直接影响整体训练周期。测试数据显示,ETH-X协议在转发性能上表现突出:交换机在无负载与有负载场景下,转发时延分别为466.5ns与469ns,均低于480ns的设计目标。结合端侧PAXI协议单向收发<200ns的超低延迟,以及400G光模块、10m光纤的传输时延,整个系统端到端RTT时延可控制在2us以内,完全满足scale-up互联的主流时延要求,这意味着AI训练中的load、store等指令同步效率将得到显著提升。
针对AI场景中常见的细粒度数据访问与大批量数据拷贝需求,测试团队分别开展了Direct Access与Direct Copy性能验证。在Direct Access测试中,ETH-X协议的报文承载效率优势明显:以128B小报文为例,PAXI PRI增强模式下的承载效率达81.26%,远超RoCEv2协议的55.65%;即使在512B报文场景下,PAXI PRI的承载效率仍保持87.97%的高水平。同时,单事务响应时延表现优异,写操作与读操作平均时延分别为1787.82ns、1789.82ns,均控制在2us以内,有效降低算力引擎的同步等待时间。而在访存队列有效吞吐测试中,随着单笔数据量增大与MAC帧长度优化,有效吞吐呈稳步上升趋势,进一步印证了协议在细粒度访问场景的适配能力。
在Direct Copy性能测试中,ETH-X协议展现出与传统技术持平的大批量数据传输能力。测试显示,RoCEv2协议在满队列状态下有效吞吐达390.66Gb/s,而ETH-X PAXI PRI增强模式在不同MAC帧长度下,均能实现接近基线的吞吐水平,且随着MAC帧长度从1KB提升至8KB,吞吐能力持续增长,可高效支撑HBM(高带宽内存)间的大规模数据搬移,同时减轻CPU与GPU的负载压力,为AI训练中的数据预处理与模型参数同步提供高效支撑。
值得关注的是,针对当前AI领域热门的MoE(专家混合模型)架构,测试团队专门验证了ETH-X协议在Dispatch(一对多)、Combine(多对一)、All-to-All(多对多)三类典型通信模式下的性能。在Dispatch与Combine场景中,ETH-X协议的通信完成时间均低于RoCEv2基线,尤其在小数据量传输时,低时延优势更为显著;在All-to-All场景下,除1792KB超大报文场景因RoCEv2包效率优势略有落后外,ETH-X在多数数据量下均能保持竞争力,且随着队列深度增加,吞吐性能持续提升,可满足MoE模型推理与训练中的复杂通信需求。
此次ETH-X Scale Up协议测试的完成,不仅验证了该协议在AI算力互联领域的技术可行性,更为后续工程优化与标准化推进提供了量化数据支撑。随着AI模型规模持续扩大,对计算集群互联的要求将进一步提升,ETH-X协议凭借低时延、高吞吐、强适配的特性,有望成为未来超节点架构互联的重要技术选择,助力AI产业突破算力瓶颈,加速大规模模型的研发与应用落地。开放数据中心委员会相关负责人表示,未来将继续推动协议的标准化工作,促进产业链上下游合作,为数据中心互联技术创新提供更多支撑。
以下为报告节选内容
报告共计: 39页
中小未来圈,你需要的资料,我这里都有!