国产算力新突破！昇腾910C助力1.6万亿大模型全参数后训练成功

发布时间：2026-06-08 13:31 来源：互联网作者：冯璃月

深圳河套学院携手哈尔滨工业大学（深圳）、深圳市大数据研究院及华为等团队，近日在国产AI算力领域取得重大突破。依托昇腾910C国产AI算力集群，该联合团队成功完成1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练，标志着中国半导体产业在复杂模型训练领域迈出关键一步。

在美方技术封锁背景下，此次突破具有特殊意义。此前业内普遍认为，国产芯片难以支撑世界级超大参数模型的全参数训练。而此次成功实践证明，国产AI算力已具备支撑万亿级模型训练的工业级能力。联合团队通过三项核心工程创新，将理论可能性转化为现实生产力。

全参数后训练的复杂性远超常规训练。该过程需同时调整1.6万亿个参数，相当于在单行道上构建多层立交桥。DeepSeek-V4-Pro采用的混合专家（MoE）架构更增加了训练难度——推理时仅需激活部分专家模块，训练时却需所有专家同步学习，数据交换量呈指数级增长。这种架构对算力分配和通信效率提出极端要求，此前被视为国产芯片的"禁区"。

联合团队通过三大技术突破破解难题：其一，创新分布式显存管理方案，将巨型模型拆解为可由多张芯片协同处理的模块，实现数据交换的毫秒级同步；其二，开发动态负载均衡算法，解决MoE架构中常见的算力分配不均问题，使跨卡通信效率提升40%；其三，构建全链路监控系统，确保1500余个训练步骤零中断运行，形成包含错误预测、自动修复的容错机制。

技术突破带来的性能提升显著。模型算力利用率突破30%，关键训练算子效率提升14%。这一数据已达到国际先进水平，即便使用顶级海外芯片，多数团队也仅能实现40%左右的利用率。更关键的是，此次突破验证了国产算力在复杂工程场景下的可靠性。

比技术突破更具战略价值的是人才梯队建设。深圳河套学院将此次攻关转化为实战教学场景，构建"青年教师-博士生-工程团队"三级培养体系。42名学生从环境搭建到故障排查全程参与，在真实万亿级集群中积累工程经验。这种"战训结合"模式，解决了高端AI人才培养中"理论脱离实践"的痛点。

当前国产算力在单卡性能和软件生态方面仍存差距，但此次突破证明，通过系统工程创新，完全可以在特定领域实现弯道超车。随着更多团队加入国产算力生态建设，中国AI产业正在构建涵盖芯片设计、模型训练、应用落地的完整技术体系。这场静悄悄的技术革命，正在改写全球AI竞争的底层逻辑。

更多>同类内容