华为推出CloudMatrix 384 AI算力集群，专注突破大规模训练瓶颈

时间：2025-05-20 12:45

小编：星品数码网

在全球信息技术重心快速向AI转型的背景下，华为近日在AI峰会上推出了其全新的AI算力解决方案——CloudMatrix 384（CM384），旨在解决大规模AI模型训练和推理过程中面临的瓶颈问题。这一的发布，不仅是华为在AI领域的技术创新体现，也是对全球市场需求变化的快速响应。

全球背景与技术认可

自美国对华为实施一系列的芯片禁令以来，业界普遍将此视为华为技术实力得到全球认可的表现。华为在AI及云计算领域的持续投入，已日渐成为业界的佼佼者。在这种背景下，CloudMatrix 384的推出，更加巩固了华为在AI算力领域的地位。

CloudMatrix 384技术优势

华为CloudMatrix 384算力集群在设计上着重打破传统架构的局限，采用全对等互联的架构理念，从根本上提高了数据传输的效率。黄瑾，华为云副总裁，在AI峰会上详细介绍了CM384的技术优势。相比于英伟达的解决方案，CM384在内存容量和带宽方面具有显著优势：其总内存的容量是英伟达方案的3.6倍，而内存带宽也提升至2.1倍。这些硬件配置为大规模AI模型的训练和推理提供了高效支持。

AI训练的演变

传统的AI模型训练经历了几个重要阶段：从早期的小模型在单卡上训练，小参数大模型在单机上训练，再到的MoE（混合专家）、长序列以及多模态大模型的集群训练。在过去八年，单卡硬件的算力增长了40倍，但节点内的总线带宽仅增长了9倍，而跨节点的网络带宽增长更是仅为4倍。这种不匹配使得集群之间的网络通信成为现阶段大模型训练和推理的主要挑战。

工程创新的必要性

华为通过CloudMatrix 384的推出，顺应了这一趋势。超节点架构的采用，不仅仅是对单点技术的突破，更是系统性的工程创新。黄瑾指出，CloudMatrix 384将通信效率、内存墙制约和可靠性短板三大技术挑战作为首要课题进行攻克。通过新型的高速互联总线，连接384张卡形成超级云服务器，最大算力规模可达到300Pflops，领先行业同类产品67%。

服务全球客户

华为云不仅关注技术的前沿，更致力于使这些技术为世界各地的客户所用。通过持续升级昇腾AI云服务，华为为客户提供性能优越、可靠性强且性价比高的AI算力云服务。目前，CloudMatrix 384已经全面适配了包括DeepSeek在内的160多个大模型，通过云服务助力客户进行模型开发、训练、托管和应用。

华为CloudMatrix 384的发布标志着AI算力领域的一次重大突破。伴随AI技术的不断深化和应用范围的日益扩大，企业面临的计算需求也日益迫切。华为的这一创新解决方案不仅为大规模AI训练提供了强有力的技术支持，同时也为AI产业的发展开辟了新的路径。

在未来的科技浪潮中，华为将继续以创新为动力，推动算力架构的演进，确保其在全球AI领域的领导地位。面对不断增长的市场需求与技术困境，华为以实际行动证明了其在技术研发上的深厚积淀与持续进化的能力。

华为推出CloudMatrix 384 AI算力集群，专注突破大规模训练瓶颈

精品推荐

相关文章