智能体深度应用词元消耗激增 降本增效路在何方?

   发布时间:2026-04-04 05:15 作者:顾雨柔

随着人工智能技术在各领域的渗透,关于大模型使用中Token消耗与成本控制的讨论日益成为焦点。Token作为大模型处理信息的最小单元,无论是日常提问还是生成内容,每一次交互都伴随着它的消耗。近期,智能体应用如“龙虾”的兴起,进一步推高了Token的使用需求,也让成本问题愈发凸显。

记者调查发现,智能体产品落地初期,简单交互场景的成本变化并不显著,但深度使用场景中,Token消耗量会呈指数级增长,直接推高使用成本。个人用户秦先生表示:“任务复杂度稍有提升,成本就明显增加,Token消耗与任务难度不成正比,超出预期。”企业层面的感受更为强烈——规模化应用AI的企业日均Token消耗已达百亿级,以中交AI中心为例,其开发的数千个智能体日均消耗上百亿Token,对应成本约十万元。

持续增长的Token需求对算力系统构成挑战。MiniMax稀宇科技副总裁严奕骏透露,公司每周都要进行算力扩容,算力资源始终处于“紧平衡”状态。中国电信北京公司AI技术负责人陈哲诗观察到,大模型技术演进拉动了应用层需求,算力租赁市场火爆,但客户对成本敏感度较高,优化基础设施效率、降低Token成本成为行业共同诉求。

Token与手机流量的计费逻辑本质不同。手机流量按传输量计费,缓存内容可重复使用,成本清晰可控;而Token作为AI处理信息的计量单位,用户需支付模型空间占用费、服务套餐费,每条指令执行都会产生实时消耗,功能扩展或权限开放还会带来额外支出。这种差异导致深度使用场景下,Token成本增长远高于流量成本。

降低Token成本已成为行业共识。中国信息通信研究院云计算与数字化研究所主任马飞分析,当前成本偏高源于行业处于发展初期,高端算力硬件成本高、资源利用率不足等多重因素叠加。随着技术成熟和算力供给优化,单位Token成本将逐步下降,需求爆发也将倒逼产业加速迭代。

企业正在通过多路径降本。月之暗面Kimi企业业务负责人黄震昕表示,公司通过底层模型架构创新提升效率,直接降低Token成本;阶跃星辰首席技术官朱亦博提出“智价比”概念,强调在保持模型智力水平的同时尽可能压缩成本。云服务机构则从资源配置入手,天翼云智算平台产品专家王曼介绍,通过算电协同、算网融合调度等技术,持续优化成本结构。

国家层面算力布局为普惠化提供支撑。中国信通院发布的《算力互联网体系架构研究报告》显示,我国智能算力规模已居全球第二,但高端算力、核心算法仍存在外部依赖。当前,全国一体化算力网络建设加速推进,通过统一调度优化资源配置,算力服务可触达性显著提升。同时,轻量化、低功耗本土大模型的发展,让更多普通用户能够以较低成本享受AI服务。

中国信通院云计算与数字化研究所副所长栗蔚认为,Token作为AI产业度量衡,其消耗总量反映应用深度,成本则体现算法算力效率。要实现Token普惠化,需构建优质算法、持续优化模型,降低单Token算力消耗,并搭建随需接入的算力节点网络,让AI服务真正走进千家万户。

 
 
更多>同类内容
全站最新
热门内容
本栏最新