在COMPUTEX 2026开幕演讲上,高通公司总裁兼CEO安蒙提出一个引人注目的观点:2026年将成为“智能体之年”。这一判断并非空穴来风,而是基于AI行业当前的发展趋势——随着算力与模型参数规模逐渐触及瓶颈,业界开始将目光转向应用端,探索如何让AI真正落地并服务于日常生活,智能体因此成为新的焦点。
传统AI更多被视为一个“回答问题的工具”,用户输入指令,模型生成答案,交互的主动权始终掌握在人类手中。而智能体AI则截然不同,它不仅要理解问题,更要深入解析用户意图,持续追踪上下文,拆解复杂任务,调用各类工具,并在多个系统和设备间无缝协作。简言之,AI正从“辅助回答”迈向“主动完成”,这一转变正由智能体引领。
近期,OpenClaw、Hermes等智能体的涌现,不仅刷新了人们对AI能力的认知,也暴露出智能体落地面临的诸多挑战。高通在演讲中反复强调“计算连续体”的概念,正是为了应对这些挑战。当AI进入智能体阶段,问题不再局限于模型是否足够强大,而是扩展到智能体的运行位置、成本控制、时延保障、隐私保护以及用户随时随地使用的可行性。
若将所有智能体工作负载集中于云端,将面临高昂的Token成本、网络延迟、能源消耗以及隐私泄露等风险,这些因素均可能成为智能体规模化落地的障碍。高通提出的解决方案,是将智能体AI从数据中心延伸至手机、PC、汽车、机器人、工业设备乃至未来网络中,使AI成为遍布每个计算节点的新型基础能力,而非仅停留于云端的一朵“云”。
智能体AI与传统AI的核心差异在于其自主性与复杂性。传统AI如同一个高效的问答系统,能够完成文案撰写、总结提炼、翻译等基础任务,但往往需要用户不断输入指令,引导其下一步行动。而智能体AI则只需用户设定一个目标,便会围绕该目标持续运作,直至达成目的。在此过程中,它会自行制定任务、执行、复盘,宛如人类般工作。
以“准备今日工作简报”为例,智能体不会仅生成一段文字,而是会先分析完成目标的前提条件,进而读取邮件、日历、本地文档及会议记录,判断今日重要事项,整理待办清单,最终调用Word等工具生成最终文档。这一过程中,文件索引、局部摘要、个人数据读取及任务编排等环节,均可在本地或边缘设备完成,无需全部上传至云端,从而降低成本、减少延迟并保护隐私。
安蒙在演讲中指出,对话式AI、推理AI与智能体AI的Token需求并非线性增长,而是随任务复杂度的提升呈指数级增长。简单问答可能仅消耗有限Token,但多轮推理、多工具调用、多智能体协作及持续上下文状态维护,将导致Token消耗急剧增加。因此,AI产业不能仅依赖堆砌云端算力,而需更智慧地利用算力,这正是高通提出“计算连续体”的初衷。
按照高通的设想,智能体工作负载应根据成本、性能、时延、功耗及隐私需求,在终端设备、边缘侧、本地服务器与云端之间动态分配。简单、本地化、强隐私的任务可置于设备端;高上下文、高复杂度、需大模型能力的任务则交由云端处理;边缘设备与本地AI工作站则承担过渡角色。这种分工并非简单的“端侧AI取代云端AI”或“云端AI压倒端侧AI”,而是对整个计算架构的重新规划。
对于高通而言,这一转变与其长期深耕的移动计算领域高度契合。过去几十年,高通始终致力于在有限功耗与体积内提供强大计算能力,手机、耳机、可穿戴设备、汽车、机器人及PC等形态各异的设备,均面临能效、连接与性能之间的平衡挑战。智能体时代的到来,使高通在芯片能效上的优势得以扩展至整个AI计算体系,从毫瓦级可穿戴设备到千瓦级数据中心推理系统,高通希望串联起不同层级的计算能力,让智能体在最合适的位置运行。
智能体AI的普及,将首先改变用户日常使用的设备——手机。智能手机作为数字生活的中心,已围绕其构建起包括智能手表、无线耳机及智能家电在内的IoT生态。然而,在安蒙看来,智能体时代将重塑这一中心:未来数字生态的核心将不再是手机或操作系统与应用,而是智能体本身,设备则成为智能体的端点。
这意味着,智能体AI将具备跨设备跟随用户的能力。例如,用户在手机上提出需求,若手机认为无法处理,便可交由PC继续;当用户戴上智能眼镜时,智能体又能通过摄像头与麦克风获取新感知输入,结合手机与PC上的任务,进一步提供服务。手机与PC将不再仅仅是运行应用的机器,而是用户接入智能体的首要入口。
高通在演讲中强调,当前设备多为人主动操作设计,用户点开App、输入内容、等待反馈,这是移动互联网的基础交互逻辑。但智能体AI将带来另一种模式:即使用户未持续操作,智能体也会在后台理解上下文、规划步骤、协调任务,并在合适时机给出结果。这对硬件提出了更高要求,不仅需要更强的CPU进行任务编排、工具调用与系统协调,还需高能效NPU与GPU运行本地模型与并行推理任务。更丰富的传感器与连接能力也是必需,以便智能体主动理解用户环境,结合历史记录与个人数据判断真实需求。
高通将手机、AI PC与个人AI设备置于同一主线讨论,正是基于这一逻辑。手机与PC掌握用户在不同场景下的个人数据,打通两者隔阂,智能体才能释放全部潜力。同时,个人AI设备将为计算终端提供更多环境信息,协助终端完成任务推理。这一智能生态的未来,是让用户在任意设备上获得完全相同的智能体验,实现“AI无处不在”。
高通在汽车领域的布局也体现了这一趋势。随着汽车智能化程度加深,AI在汽车上不再仅限于车机助手。安蒙认为,未来汽车将同时拥有面向用户的个性化智能与负责感知与驾驶的实体AI,前者理解用户需求,后者理解道路环境,共同构成AI定义汽车的新形态。机器人则进一步展现了实体AI设备的任务复杂性,它不仅需要推理与规划能力,还需具备实时控制、传感器融合与可靠执行能力,是移动计算、边缘AI与智能连接能力的综合体现。
高通正将自身优势带入机器人领域,通过低功耗计算、异构计算与系统级集成能力,使部分感知、控制与边缘推理任务能在更靠近数据源的位置完成,从而降低时延与中心计算压力,提升机器人响应速度与续航表现。同时,高通也在探索将6G纳入这一体系的方法,未来网络不仅负责连接,还将承担部分计算与感知任务,使设备、边缘与云端形成更紧密的协同关系。
高通已正式推出Qualcomm AI200、AI250等千瓦级算力服务器,并与超大规模云服务商及全球合作伙伴推进真实部署。随着数据中心产品组合拓展,其产品将覆盖从最小型可穿戴设备到高性能推理数据中心的每一个层级,打造一个“从毫瓦级到千瓦级”的全链路算力生态,这也是高通提出“计算连续体”的底气所在。
安蒙在COMPUTEX的主旨演讲,透露出高通更宏大的愿景:成为智能体时代的底层平台提供者,而非仅提供一颗更强的AI芯片。从手机、PC到汽车、机器人与数据中心,高通强调的是同一逻辑:智能体不会仅运行于云端,而是分布于各种终端与边缘节点之中。因此,未来竞争的重点不仅是单点算力,而是如何构建覆盖设备、网络、边缘与云端的完整计算体系。这正是“计算连续体”的核心意义,也是高通在AI时代的新定位。






















