人工智能芯片领域迎来重大合作动向。亚马逊与AI芯片初创企业Cerebras Systems正式签署协议,将双方技术整合至全新服务架构中,重点提升聊天机器人、编程工具等AI应用的运行效率。此次合作标志着科技巨头与新兴芯片厂商在算力市场展开深度协同。
估值达231亿美元的Cerebras以研发差异化芯片著称,其技术路线与英伟达主流产品形成鲜明对比。今年初,该公司已与OpenAI达成百亿美元级芯片供应协议,为后者旗下热门聊天机器人提供底层算力支持。此次与亚马逊的合作将进一步拓展其技术落地场景,通过云服务触达更广泛的用户群体。
根据合作方案,Cerebras芯片将部署于亚马逊云服务(AWS)数据中心,与亚马逊自研的Trainium3芯片形成互补架构。双方通过定制化网络技术实现硬件互联,构建起覆盖AI推理全流程的解决方案。Cerebras首席执行官Andrew Feldman指出,AWS庞大的用户基础涵盖个人开发者到金融机构等各类客户,新服务将通过"一键式"操作降低算力使用门槛。
合作聚焦AI推理环节的优化,该过程涉及已训练模型对用户请求的响应与答案生成。双方将任务拆解为两个阶段:Trainium3芯片负责将自然语言转化为AI可识别的"token"语言(预填充阶段),Cerebras芯片则承担答案生成(解码阶段)。这种分工模式旨在提升系统整体响应速度,满足大规模用户并发需求。
行业分析显示,AI产业正从模型训练向推理应用加速转型。尽管GPU在训练阶段占据主导地位,但其在推理场景中的延迟问题日益凸显。随着AI工具用户量突破百万级,企业开始寻求多元化芯片解决方案。亚马逊声明强调,其新服务预计下半年上线,在性价比方面将优于市场现有GPU产品,Trainium系列后续迭代版本将持续保持成本优势。
值得关注的是,英伟达近期也在推进类似战略。该公司计划在下周公布GPU与初创企业Groq芯片的整合方案,后者于去年12月被英伟达以170亿美元收购。不过亚马逊方面表示,由于英伟达方案细节尚未披露,暂无法进行直接对比,但强调Trainium3项目距离投入生产仅剩数月时间。
Feldman透露,AI应用场景的复杂化与使用频率的提升,为Cerebras技术创造了广阔市场空间。通过与亚马逊的合作,其芯片将进入全球最大云平台,直接对接海量客户需求。这种技术整合模式或将成为AI基础设施领域的新趋势,推动算力市场形成多极竞争格局。





















