智能体深度应用词元消耗激增降本增效路在何方？

发布时间：2026-04-04 05:15 来源：快讯作者：顾雨柔

随着人工智能技术在各领域的渗透，关于大模型使用中Token消耗与成本控制的讨论日益成为焦点。Token作为大模型处理信息的最小单元，无论是日常提问还是生成内容，每一次交互都伴随着它的消耗。近期，智能体应用如“龙虾”的兴起，进一步推高了Token的使用需求，也让成本问题愈发凸显。

记者调查发现，智能体产品落地初期，简单交互场景的成本变化并不显著，但深度使用场景中，Token消耗量会呈指数级增长，直接推高使用成本。个人用户秦先生表示：“任务复杂度稍有提升，成本就明显增加，Token消耗与任务难度不成正比，超出预期。”企业层面的感受更为强烈——规模化应用AI的企业日均Token消耗已达百亿级，以中交AI中心为例，其开发的数千个智能体日均消耗上百亿Token，对应成本约十万元。

持续增长的Token需求对算力系统构成挑战。MiniMax稀宇科技副总裁严奕骏透露，公司每周都要进行算力扩容，算力资源始终处于“紧平衡”状态。中国电信北京公司AI技术负责人陈哲诗观察到，大模型技术演进拉动了应用层需求，算力租赁市场火爆，但客户对成本敏感度较高，优化基础设施效率、降低Token成本成为行业共同诉求。

Token与手机流量的计费逻辑本质不同。手机流量按传输量计费，缓存内容可重复使用，成本清晰可控；而Token作为AI处理信息的计量单位，用户需支付模型空间占用费、服务套餐费，每条指令执行都会产生实时消耗，功能扩展或权限开放还会带来额外支出。这种差异导致深度使用场景下，Token成本增长远高于流量成本。

降低Token成本已成为行业共识。中国信息通信研究院云计算与数字化研究所主任马飞分析，当前成本偏高源于行业处于发展初期，高端算力硬件成本高、资源利用率不足等多重因素叠加。随着技术成熟和算力供给优化，单位Token成本将逐步下降，需求爆发也将倒逼产业加速迭代。

企业正在通过多路径降本。月之暗面Kimi企业业务负责人黄震昕表示，公司通过底层模型架构创新提升效率，直接降低Token成本；阶跃星辰首席技术官朱亦博提出“智价比”概念，强调在保持模型智力水平的同时尽可能压缩成本。云服务机构则从资源配置入手，天翼云智算平台产品专家王曼介绍，通过算电协同、算网融合调度等技术，持续优化成本结构。

国家层面算力布局为普惠化提供支撑。中国信通院发布的《算力互联网体系架构研究报告》显示，我国智能算力规模已居全球第二，但高端算力、核心算法仍存在外部依赖。当前，全国一体化算力网络建设加速推进，通过统一调度优化资源配置，算力服务可触达性显著提升。同时，轻量化、低功耗本土大模型的发展，让更多普通用户能够以较低成本享受AI服务。

中国信通院云计算与数字化研究所副所长栗蔚认为，Token作为AI产业度量衡，其消耗总量反映应用深度，成本则体现算法算力效率。要实现Token普惠化，需构建优质算法、持续优化模型，降低单Token算力消耗，并搭建随需接入的算力节点网络，让AI服务真正走进千家万户。

更多>同类内容