港股“国产GPU第一股”壁仞科技近日交出上市后首份年度成绩单,其2025年财报显示,公司全年营收突破10亿元大关,达到10.35亿元,同比激增207.2%;毛利同步攀升至5.57亿元,增幅达210.8%,毛利率稳定在53.8%的高位。这一数据不仅印证了国产GPU企业的商业化能力,更折射出全球AI算力市场正经历结构性变革——从“训练主导”加速转向“训推并重”的新阶段。
在研发投入上,壁仞科技延续“高压”策略,全年研发支出达14.76亿元,同比增长78.5%。尽管经调整年内亏损仍达8.74亿元,但收入增长已显著摊薄前期投入,经营杠杆效应初步显现。截至2025年底,公司现金及金融资产储备达28.96亿元,叠加2026年初IPO募资净额56.31亿元,总资金池超85亿元,为产能扩张与技术迭代筑起坚实壁垒。
全球AI产业正迎来“推理时代”的拐点。英伟达创始人黄仁勋在GTC 2026大会上提出“Token经济学”概念,直言未来数据中心将转型为“Token工厂”,每瓦Token吞吐量成为核心竞争力。他预测,受推理需求爆发驱动,2027年全球AI基础设施市场规模将突破1万亿美元。这一判断与市场数据高度契合:OpenRouter平台显示,3月23日至29日,国产大模型调用量连续四周超越海外模型,前九名中占六席,总调用量达9.82T,环比增长33.4%,而海外模型总调用量则下滑15.4%。
推理算力的爆发式需求,正重塑下游客户对算力的评价标准。过去市场盲目追逐单卡峰值算力,如今则更关注系统级全栈效率、能效比与长期稳定性。壁仞科技精准卡位这一需求变迁,2025年完成旗舰GPU产品BR106及BR166的全形态量产,其中BR166系列8月投产,半年内即实现规模化交付。同时,公司交付多个千卡级智算集群,包括2048卡光互连超节点集群,并拓展至国家级算力平台、电信运营商等高端客户群体,直接推动智能计算解决方案收入同比增长205.1%,达10.27亿元。
算力需求的井喷式增长,已引发全球产业链“通胀”。2026年一季度,亚马逊云科技、谷歌云等头部厂商相继提价,部分区域数据传输价格涨幅高达60%-100%;国内服务商也对高耗能套餐上调超30%。硬件端同样承压,英特尔、AMD等CPU大厂自25Q4起涨价10%-15%,交货周期大幅延长。SEMI中国区总裁冯莉指出,2026年全球AI基础设施支出将达4500亿美元,推理算力占比首超70%,但HBM等关键部件产能缺口仍达50%-60%,高端算力结构性短缺将持续。
在此背景下,具备本土化交付能力与供应链韧性的国产算力企业迎来替代窗口期。壁仞科技通过前瞻性布局构建护城河:截至2025年底,存货余额达9.49亿元,同比增长520.4%,以锁定关键产能;超85亿元资金储备则支撑其持续投入研发与市场扩张。这种“资金+供应链”的双重保障,使其在算力通胀周期中占据先机。
推理时代对算力系统的要求已从单点性能转向整体工程能力。壁仞科技交付的千卡集群采用“光跃 LightSphere X”超节点方案,基于光互连与分布式光交换技术,实现30天无故障运行且线性加速比超95%,验证了其支撑大规模并行计算的高可用性。软件生态层面,公司持续优化对Pytorch、vLLM等开源框架的支持,并推动BIRENSUPA™软件栈开源,目前已全面适配DeepSeek V3/R1、MiniMax M2等头部大模型,实现“Day 0”级别全栈适配。
技术迭代方面,壁仞科技计划2026年推出下一代BR20X芯片及全系列产品,专为推理时代优化算力密度、内存容量与互连能力,并原生支持FP8与FP4低精度计算。集群扩展性上,BR20X将基于自研互连协议Blink 2.0推出超节点方案,最大支持千卡规模集群的Scale-up。从芯片到系统再到生态,壁仞科技已构建起“三位一体”的商业模式闭环,并深度嵌入金融科技、智能制造、智能教育等垂直领域,成为托举国产AI产业发展的核心底座。





















