智元Act2Goal方案亮相:世界模型赋能机器人“以终为始”精准达目标

   发布时间:2025-12-31 19:29 作者:柳晴雪

智元机器人近日宣布推出一项名为Act2Goal的创新操作算法,为机器人领域带来全新突破。该算法突破传统机器人机械执行指令的模式,赋予机器人“以终为始”的智能思维,使其能够自主规划达成目标的路径。

Act2Goal的核心创新在于引入“目标条件世界模型”,将视觉推理与动作控制整合为端到端架构。这一设计使机器人不再局限于“看一步走一步”的简单模式,而是具备构建从现状到目标的完整因果链条的能力。实验表明,在面对陌生环境和物体时,该算法展现出惊人的零样本泛化能力,仅需数分钟在线自我磨练,复杂任务的成功率即可从30%提升至90%。

该算法通过多尺度时域哈希(MSTH)机制实现精细操作与全局规划的平衡。系统将任务过程分解为短时精细段和长时粗粒段:前者以高频采样确保机械臂动作精度,后者通过自适应采样实现全局路径规划。这种设计有效防止了误差累积和目标偏离,使机器人在长时序操作中既能保持局部动作精确性,又能确保整体目标方向一致性。

离线模仿学习阶段,系统通过大规模数据训练微调预训练模型,生成多视角、多尺度的视觉轨迹。动作生成模块与世界模型联合训练,形成从视觉感知到动作生成的完整闭环。这种训练方式使机器人能够根据当前状态和目标状态预测未来轨迹,并生成可执行动作,为复杂任务提供稳定支撑。

针对真实环境中的未知挑战,Act2Goal设计了在线自我提升机制。通过回顾性经验重放技术,机器人自动收集执行过程中的状态、动作和结果数据,并将轨迹重新标注为新目标示例存入缓冲区。系统仅更新新增的LoRA层参数,保持基础模型冻结,这种轻量化微调方式使机器人能快速适应新任务,在未见过的环境中保持稳定操作。

部署Act2Goal的G01机器人在多项域外任务中表现优异,包括绘制未见过的图案等复杂操作。该算法通过显式建模目标演化过程,为机器人操作提供了全新范式,其“先理解世界变化再决策行动”的思路,为开发更通用、可靠的机器人系统奠定了重要基础。

 
 
更多>同类内容
全站最新
热门内容
本栏最新