近日,作为全球运营商最大单集群智算中心,中国移动智算中心(哈尔滨)正式上线投产。该智算中心具有单集群算力规模最大、国产化网络设备组网规模最大等特点。
中国移动智算中心(哈尔滨)单集群内超过1.8万张AI加速卡,智能算力规模达6.9EFLOPS。该集群规模应用高性能无损网络、全调度以太网GSE1.0、融合分级存储等多项创新技术,搭载移动云智算平台和智管平台,支持万卡并行训练、断点续训、AI任务全生命周期管理及分钟级故障定界定位等功能,集群算效与能效均达到行业领先水平。该集群也是继中国移动智算中心(呼和浩特)(全球运营商最大单体智算中心)上线运行后,中国移动打造的业内首个端到端使用全国产设备的超大规模智算集群,标志着我国国产芯片商用部署达到了新的高度。
中国移动智算中心(哈尔滨)把所有AI加速卡打造成1个集群,通过先进的智算网络技术把上万块GPU芯片像“积木”一样拼接在一起,大幅提升GPU节点间的通信效率,将数据训练完成时间缩短20%,从而形成超级算力集群,能满足万亿参数的大模型训练要求。
文章来源:中国移动通信集团有限公司