智元Act2Goal方案,让机器人用一张照片学会所有任务
创始人
2026-01-06 04:00:33
0

在机器人领域,一个看似简单的任务往往需要复杂的指令和反复调试。但智元具身研究中心给出了一种颠覆性的答案:给机器人一张"目标照片",它就能自己想办法把面前的场景变成照片里的样子。

智元于近日正式发布Act2Goal方案,这不仅是一个新的操作算法,更是一种让机器人"以终为始"的全新思维方式。与传统机器人机械地执行死板指令不同,Act2Goal引入了"目标条件世界模型",使机器人不再只是"看一步走一步",而是拥有了预见未来的能力——在真正动手之前,它已经在大脑中构建了从现状通往目标的完整因果链条。

从"看一步走一步"到"以终为始"

在传统机器人操作中,系统通常只关注当前状态与目标状态,而缺乏对两者之间任务过程的显式建模。主流方法多采用直接映射的范式,将当前观测与目标状态输入策略网络以预测动作,这使得机器人难以判断执行进度,也容易在任务延长或环境变化时出现误差累积。

Act2Goal则通过在动作生成之前引入目标条件世界模型,对从当前状态到目标状态的演化过程进行建模,并生成一系列中间视觉状态作为任务进程的结构化表征,为机器人动作提供明确操作锚点。

"我们相信,这种‘先理解世界如何变化,再决定如何行动’的思路,将为更通用、更可靠的机器人系统提供重要支撑。"智元技术团队解释道。

零样本泛化与自我进化能力

Act2Goal最令人惊叹的特性在于其"零样本泛化能力"和"自我进化"本能。系统能够在从未见过的环境和物体面前,展现出惊人的零样本泛化能力,无需人类手把手教(无奖励信号),就能在真实世界的交互中快速"复盘"自己的行为轨迹。

实验数据显示,面对高难度的陌生任务,Act2Goal仅需数分钟的在线自我磨练,成功率就能从30%提升至90%。这一性能提升速度,远超传统机器人学习模式。

"这不仅仅是技术的进步,更是机器人认知方式的革命。"一位具身智能行业专家表示,"它让机器人从'执行者'转变为'思考者'。"

Act2Goal的训练过程分为两个阶段:首先通过大规模离线模仿学习进行训练,系统微调预训练的世界模型,使其能够生成从当前状态到目标状态的多视角、多尺度视觉轨迹;随后引入在线自我提升机制,利用回顾性经验重放(HER)实现自主性能优化。

在执行过程中,机器人会自动收集每一步的状态、动作及执行结果,并将轨迹重新标注为新的目标示例,存入回放缓冲区。无论任务是否成功完成,系统都能利用这些数据进行端到端微调,仅更新新增的LoRA层参数,基础模型保持冻结。

"部署Act2Goal模型的机器人在多个域外任务上展现出色性能,甚至能在线练习绘制未见过的图案,持续提升性能。"智元技术团队表示。

从实验室到真实世界的跨越

Act2Goal的核心贡献在于重新审视了目标条件操作中的一个基本问题:从当前状态到目标状态之间,机器人是否真正理解过程?通过在策略中显式引入目标条件世界模型,并结合多尺度时间建模与深度融合机制,Act2Goal为目标条件机器人操作提供了一种新的建模范式。

"我们相信,这种'先理解世界如何变化,再决定如何行动'的思路,将为更通用、更可靠的机器人系统提供重要支撑。"智元研究团队表示。

随着智能制造、服务机器人和家庭自动化需求的不断增长,Act2Goal所代表的技术路线有望成为下一代机器人系统的标准配置,推动机器人从"工具"向"伙伴"的转变,让机器真正"懂"得如何达成目标。

从工业端来看,装配、分拣等长时序任务中,机器人无需反复调试程序就能适配不同批次产品,可大幅提升生产效率;从消费端而言,服务机器人能快速理解用户的模糊需求(如“把桌子摆成照片里的样子”),无需用户学习复杂指令,加速走进家庭和门店。

当前,具身智能赛道正处于“技术比拼转向商用落地”的关键阶段,Act2Goal的推出,不仅强化了智元的技术壁垒,更可能推动行业从“单一任务机器人”向“通用智能机器人”跨越。随着方案在智元现有机器人产品线的适配,其商业化效果或将在2026年逐步显现,进一步改写全球具身智能的竞争格局。

采写:南都·湾财社记者 胡雯雯

相关内容

热门资讯

千方科技:详述人工智能应用端优... 来源:问董秘 投资者提问: 公司在人工智能应用端有什么优势吗 董秘回答(千方科技SZ002373):...
工信部力推工业互联网平台发展 ... 转自:中国经营网 中经记者 孙丽朝 北京报道 工业互联网平台是海量数据汇聚、模型沉淀和应用开发的关键...
麒麟软件智能系统升级 最近,麒麟软件研发的操作系统,搭载的智能体,取得了新进展,提升了复杂问题处理能力。 作为中国电子旗下...
AIGC加速器开营 多方共建智... 央广网北京1月14日消息(记者 阮修星)近日,AIGC加速器(首期)在北京中关村互联网3.0产业园(...
【科技前沿】“天马-1000”... 11日,由中国兵器工业集团西安爱生技术集团有限公司完全自主研发,有着“智能空中货拉拉”之称的“天马-...
一边爆炸断电,一边AI抢电!特... 一则消息突然刷屏。 1月13日,据央视新闻,当地时间1月12日傍晚,美国俄亥俄州克利夫兰市西部地区一...
英伟达推理上下文内存存储对NA... 花旗认为,英伟达在AI推理应用中采用的上下文内存存储技术,预计将加剧NAND闪存市场的供应短缺。 据...
菲利华:公司是国内航空航天领域... 证券日报网讯 1月14日,菲利华在互动平台回答投资者提问时表示,石英玻璃纤维和以石英玻璃纤维为基材的...
沈阳钧成材料取得锻造温度调节装... 国家知识产权局信息显示,沈阳钧成材料科技有限公司取得一项名为“一种锻造温度调节装置”的专利,授权公告...
原创 S... 1月14日消息,继上个月美国存储芯片大厂美光科技(Micron)正式宣布将退出 Crucial 消费...
天津国际焊接与激光展3月即将启... 天津北方网讯:近日,天津工博会传来好消息——中国焊接协会联合振威国际会展集团主办的2026天津国际焊...
阿坝发展万象新 | 九寨沟县迈... 近日,阿坝移动顺利完成九寨沟核心区域5G-A网络部署,核心区域实测平均下载速度突破1500Mbps,...
河南新乡:“黑科技”入驻博物馆... 当商代牛头爵、父己方鼎等国宝级文物,遇上“3D+VR”显示技术,将产生怎样的视觉冲击力? 没错,它们...
盐池县总工会:AI赋能数智化培... 为顺应数字化发展趋势,破解机关干部办公效率提升难题,1月13日,盐池县总工会组织开展工会数智化办公专...
谷歌重新拥抱被冷落的JPEG ... 谷歌已将JPEG XL(JXL)图像格式支持添加到开源Chromium代码库中,这一决定逆转了202...
正业科技:未向华为提供锂电智能... 证券之星消息,正业科技(300410)01月13日在投资者关系平台上答复投资者关心的问题。 投资者提...
硬科技龙头企业开启“规模化元年... 新华社北京1月14日电 《中国证券报》14日刊发文章《从技术验证迈向量产交付硬科技龙头企业开启“规模...
电竞手机性价比之争:2026年... 在2026年的电竞手机市场,性能与价格的平衡成为玩家最关注的焦点。随着移动游戏画质和帧率要求的不断提...
瑞银:2026年AI应用市场或... 中证报中证网讯(记者 魏昭宇)1月13日-1月14日,第二十六届瑞银大中华研讨会在上海举办。展望20...
祝融号新发现让寻找火星生命再添... IT之家 1 月 14 日消息,据央视新闻今日报道,我国“祝融号”火星车最近给乌托邦平原南部做了一次...