谷歌Gemini机器人新突破:离线AI让机器人更灵活应对新挑战
创始人
2025-06-29 08:21:24
0

近期,谷歌在人工智能领域的一项新进展引起了广泛关注。在一则最新播客节目中,一款搭载了Gemini人工智能技术的机器人,在没有事先教导的情况下,成功完成了一次“扣篮”动作,展现了其迅速适应新环境的能力。

这一壮举紧随其在洛杉矶RSS2025(机器人软件与系统大会)上的全球首次互动式现场展示。会上,运行着Gemini Robotics On-Device模型的机器人吸引了众多目光。硅谷AI领域的观察者Ted Xiao对此评论道:“这仿佛是对未来的一次神奇预览——只需与机器人进行对话,它就能做出恰当的回应,并尝试执行一系列合理的操作,无论是面对新的物体、命令还是技能。”

Gemini Robotics On-Device模型于6月24日正式发布,这一创新将AI引入了机器人领域,且整个过程中无需持续依赖互联网连接,实现了离线工作。谷歌在X部门强调,这是他们首个“视觉-语言-动作”模型,旨在帮助机器人更快、更高效地适应各种新任务和新环境。

回顾今年早些时候,Figure公司发布的“历史上最重大的人工智能更新”——Helix,同样是一款专注于通用人形机器人控制的“视觉-语言-动作”(VLA)模型。然而,与Figure的模型不同,谷歌的这款模型能够独立于数据网络运行,这对于对延迟敏感的应用尤为关键,确保了即使在间歇性或无网络连接的环境中也能稳定运行。

事实上,早在今年3月,谷歌就已推出了第一代VLA(视觉语言动作)模型Gemini Robotics,将Gemini 2.0的多模态推理和现实世界理解能力引入物理世界。而此次发布的Gemini Robotics On-Device模型,作为双臂机器人的基础模型,除了极大地减少了计算资源需求外,还主要解决了三个核心问题:灵巧操作、新任务的快速适应以及基于本地运行的低延迟推理。

在官方演示视频中,一对灵巧的机械手不仅能够轻松拿起一支笔,还能相互配合拔掉笔盖。随后的测试中,这对机械手成功完成了“放置蓝色砖块”、“拉开中间抽屉”以及“归位‘梨’模型”等任务,仅凭自然语言指令如“Can you close the middle drawer?”(你能关上中间的抽屉吗?)就展现出了强大的视觉、语义和行为泛化能力。

除了演示之外,Gemini Robotics On-Device模型在基础跑分数据上也表现出色。在泛化能力方面,尽管略低于谷歌旗舰Gemini Robotics模型的表现,但仍远超之前最好的离线模型。在分布式任务和复杂多步骤指令方面,该模型也优于其他设备端替代方案。

面对家中无数形状、大小、颜色和纹理各异的物品,机器人需要能够按需产生智能的新行为,尤其是对于那些从未见过的物体。机器人技术的一大挑战在于,举一反三并非易事。而Gemini Robotics On-Device模型通过50到100次演示即可快速适应新任务,展现了其强大的新任务适应能力。

谷歌还展示了这一性能在实际应用中的效果,将其调整并应用到了双臂Franka FR3机器人和Apptronik的Apollo人形机器人上。在Franka机器人上,该模型能够执行通用指令,处理以前未见过的物体和场景,完成包括折叠衣服在内的灵巧任务,以及需要精确度和灵巧性的工业皮带组装任务。在Apollo人形机器人上,通用模型同样能够遵循自然语言指令,以通用的方式操控不同的物体,包括之前从未见过的物体。

这一系列创新引发了网友的热烈讨论。有人认为,谷歌的脱机AI机器人具有改变游戏规则的可能性。然而,也有人提出质疑,询问这与特斯拉机器人的设计有何不同,以及与ylecun在meta所做的工作有何差异。在机器人/具身智能这一赛道上,各家大模型正展现出多样性和丰富性的技术向度,共同指向同一个核心命题——如何让AI在三维物理世界中建立真正的因果认知。

相关内容

热门资讯

新型成像系统可区分癌细胞与健康... (来源:科普中国) 转自:科普中国 美国密歇根州立大学科学家研发出一种新型拉曼成像系统,能通过检测附...
日盛电子申请具有充电功能的自拍... 国家知识产权局信息显示,东莞市日盛电子科技有限公司申请一项名为“一种具有充电功能的自拍杆”的专利,公...
三乐精密取得编码器防护装置专利... 国家知识产权局信息显示,无锡三乐精密机械制造有限公司取得一项名为“一种编码器的防护装置”的专利,授权...
苏试试验:可提供航天领域一站式... 证券之星消息,苏试试验(300416)12月30日在投资者关系平台上答复投资者关心的问题。 投资者提...
扎克伯格下狠手:Meta收购开... IT之家 12 月 30 日消息,meta 公司已同意收购开发 AI 智能体 Manus 的公司蝴蝶...
昊森热能取得四通控流阀专利,可... 国家知识产权局信息显示,广东昊森热能设备有限公司取得一项名为“一种四通控流阀”的专利,授权公告号CN...
2025吴晓波科技人文秀落幕 ... 封面新闻记者 付文超 12月28日,“优酷人文跨年——AI闪耀中国·2025吴晓波科技人文秀”在厦门...
航天科普+传统文化:人民 VR... 中国日报12月30日电(记者 赵磊)日前,通州湾里·王府井商圈再添文化与科技融合新地标——人民VR科...
全国产化!顺利通过168小时试... 本文转自【科技日报】; 记者 代小佩 12月29日,我国首台全面国产的大F级商用燃机项目——华电望...
清华、华科与快手联手突破:AI... 当我们使用手机拍照时,相机能够立即识别出画面中的人物和物体。与此同时,我们也经常使用AI绘画工具根据...
江苏鸿恩智能取得梁架加固结构专... 国家知识产权局信息显示,江苏鸿恩智能科技有限公司取得一项名为“一种梁架加固结构”的专利,授权公告号C...
人工智能大模型系列国家标准实施 28日,记者从市场监管总局获悉,《人工智能大模型》系列国家标准近日正式实施,标志着我国大模型产业进入...
通信与AI共振,重塑通话业务新... 通信世界网消息(CWW)随着AI技术的快速发展,通信业务迎来了前所未有的变革机遇。当前,产业界正处在...
好评如潮的圣诞皮肤,穿得少就是... 12月圣诞月,各大游戏厂商纷纷赶着节日热度吸粉,推出了各种圣诞主题皮肤和时装。比如NIKKE、碧蓝航...
王者正式服更新,3款无双上架,... 大家好,12月30日上午7点,正式服会迎来重大更新,这不仅是罕见的周二提前更新,也是2025年的最后...
王者荣耀项羽九幽镇关皮肤怎么获... 大家好,王者荣耀全新赛季中有着许多内容可以让玩家们来体验,其中项羽的新皮肤九幽镇关也会在1月8日更新...
小米澎湃OS 3正式版大规模推... 近日,小米澎湃OS官方正式宣布,澎湃OS 3系统迎来新一轮大规模正式版推送,覆盖范围扩展至多款早期发...
浙江匠选科技申请视觉激光打标机... 国家知识产权局信息显示,浙江匠选科技有限公司申请一项名为“一种视觉激光打标机”的专利,公开号CN12...
2025,迎变、应变、求变 来源:第一财经 回望2025年,新形势带来的机遇层出不穷,但各种考验似乎也更为苛刻,AI的飞速演进只...
人形机器人的“破圈”与“落地” 来源:市场资讯 (来源:大象新闻) 大象新闻记者 李莉 杨文丽 2025年,人形机器人走出实验室的“...