小米MiMo-V2.5系列API永久降价,Token Plan优化,技术升级助力成本降低

   发布时间:2026-05-27 12:29 作者:孙雅

小米科技近日宣布,其MiMo-V2.5系列API将实施永久性价格下调,最高降幅达到99%,且不再对上下文窗口长度进行差异化定价。这一调整于北京时间5月27日零时起全球同步生效,旨在为开发者提供更具性价比的AI服务。与此同时,Token Plan计费体系也迎来重大升级,用户可获得的Token用量将提升至原有水平的5至8倍,计费规则亦更加透明简化。

根据官方公告,所有当前有效订阅Token Plan的用户(包括通过百万亿Token创造者激励计划及Apache软件基金会专属福利获得权益的用户),其Credits额度将于调价生效时自动重置,并按照新规则执行。对于历史付费但已过期的用户,小米承诺将在未来一周内公布额外福利方案,进一步扩大优惠覆盖范围。

此次价格策略调整的背后,是小米技术团队在推理系统架构上的突破性优化。通过重构KV Cache在GPU显存、CPU内存与SSD之间的数据调度机制,数据搬运量较优化前减少近86%,可缓存Token数量则扩大至原来的5倍。团队还通过改进专家并行计算方案与输入长度动态分桶策略,显著提升了集群整体吞吐能力,从而在确保服务质量的前提下实现单位Token成本持续下降。

行业分析指出,小米此次API降价与计费体系改革,不仅降低了AI开发者的使用门槛,更通过技术优化形成的成本优势,为全球AI生态建设注入新动力。特别是对于需要处理长文本或高频调用API的场景,新方案将带来显著的经济效益提升。

 
 
更多>同类内容
全站最新
热门内容
本栏最新