4月7日,由中国电信与阿里云共同打造的粤港澳大湾区首个"真武"万卡智能计算集群,在韶关数据中心正式投入运营。作为国家"超大规模智算集群"新基建工程在大湾区的首个标杆项目,该集群实现了从核心芯片、云计算平台到行业应用的全链条自主创新技术体系构建,标志着我国自主可控智能算力正加速完成从核心技术突破到规模产业化应用的关键跨越。
在技术创新层面,该集群实现了多项突破性成果:通过采用卡间RoCE高性能组网技术及双平面多轨通信架构等创新手段,构建起低延迟高吞吐的智能计算网络系统。实测数据显示其端到端网络时延最低可达4微秒级精度水平,网络峰值利用率突破95%,可充分满足千亿参数规模大模型训练中大规模分布式训练所需的AllReduce、AlltoAll等超大规模数据交互需求,并稳定支撑超大规模预训练模型与推理服务。
作为国产算力基础设施的核心支撑组件,"真武"芯片展现出卓越性能指标:单机配备1.5TB超大显存容量,在多卡互联场景下实现超过700GB/s的带宽传输能力。(广角观察)












