华为云CM384算力集群:性能跃升,已超英伟达旗舰方案?

   发布时间:2025-04-18 18:47 作者:陆辰风

近期,半导体领域的权威研究与咨询机构SemiAnalysis发表了一篇专题文章,聚焦华为云最新推出的AI算力集群解决方案——CloudMatrix 384(简称CM384)。文章指出,该解决方案凭借前所未有的系统架构设计以及全栈技术的革新,在关键性能指标上成功超越了英伟达的旗舰级产品GB200 NVL72,标志着中国在AI基础设施的发展上取得了重大突破。

SemiAnalysis详细披露,华为云CM384采用了384颗昇腾芯片为核心,通过创新的全互连拓扑架构,实现了芯片间的高效协同工作。这一设计使得CM384能够提供高达300 PFLOPs的BF16密集算力,这一数字几乎达到了英伟达GB200 NVL72系统的两倍。CM384在内存容量与带宽方面同样表现出色,其总内存容量超过英伟达方案3.6倍,内存带宽也实现了2.1倍的提升,为AI训练和推理任务提供了更为强大的硬件支撑。

SemiAnalysis进一步分析,尽管单颗昇腾芯片的性能与英伟达Blackwell架构的GPU相比,仅有其三分之一左右,但华为通过巧妙的规模化系统设计,成功实现了整体算力的显著提升。在超大规模模型训练和实时推理等应用场景中,CM384展现出了更为强大的竞争力。SemiAnalysis强调,华为的工程优势不仅体现在芯片层面,更在于其系统级的创新,包括网络架构、光学互联以及软件优化等方面,这些创新使得CM384能够充分发挥集群算力,满足超大规模AI计算的需求。

此次CloudMatrix 384的发布,无疑是中国在AI计算系统领域的一次重要飞跃,展现了中国与国际巨头正面竞争的实力。SemiAnalysis在文章中特别指出,华为的规模化解决方案在技术上已经领先于英伟达和AMD当前市场上的产品一代。这一突破不仅将推动中国AI产业的发展,更将对全球AI产业的格局产生深远的影响。

 
 
更多>同类内容
全站最新
热门内容
本栏最新