谷歌Gemini机器人新突破:离线AI让机器人更灵活应对新挑战
创始人
2025-06-29 08:21:24
0

近期,谷歌在人工智能领域的一项新进展引起了广泛关注。在一则最新播客节目中,一款搭载了Gemini人工智能技术的机器人,在没有事先教导的情况下,成功完成了一次“扣篮”动作,展现了其迅速适应新环境的能力。

这一壮举紧随其在洛杉矶RSS2025(机器人软件与系统大会)上的全球首次互动式现场展示。会上,运行着Gemini Robotics On-Device模型的机器人吸引了众多目光。硅谷AI领域的观察者Ted Xiao对此评论道:“这仿佛是对未来的一次神奇预览——只需与机器人进行对话,它就能做出恰当的回应,并尝试执行一系列合理的操作,无论是面对新的物体、命令还是技能。”

Gemini Robotics On-Device模型于6月24日正式发布,这一创新将AI引入了机器人领域,且整个过程中无需持续依赖互联网连接,实现了离线工作。谷歌在X部门强调,这是他们首个“视觉-语言-动作”模型,旨在帮助机器人更快、更高效地适应各种新任务和新环境。

回顾今年早些时候,Figure公司发布的“历史上最重大的人工智能更新”——Helix,同样是一款专注于通用人形机器人控制的“视觉-语言-动作”(VLA)模型。然而,与Figure的模型不同,谷歌的这款模型能够独立于数据网络运行,这对于对延迟敏感的应用尤为关键,确保了即使在间歇性或无网络连接的环境中也能稳定运行。

事实上,早在今年3月,谷歌就已推出了第一代VLA(视觉语言动作)模型Gemini Robotics,将Gemini 2.0的多模态推理和现实世界理解能力引入物理世界。而此次发布的Gemini Robotics On-Device模型,作为双臂机器人的基础模型,除了极大地减少了计算资源需求外,还主要解决了三个核心问题:灵巧操作、新任务的快速适应以及基于本地运行的低延迟推理。

在官方演示视频中,一对灵巧的机械手不仅能够轻松拿起一支笔,还能相互配合拔掉笔盖。随后的测试中,这对机械手成功完成了“放置蓝色砖块”、“拉开中间抽屉”以及“归位‘梨’模型”等任务,仅凭自然语言指令如“Can you close the middle drawer?”(你能关上中间的抽屉吗?)就展现出了强大的视觉、语义和行为泛化能力。

除了演示之外,Gemini Robotics On-Device模型在基础跑分数据上也表现出色。在泛化能力方面,尽管略低于谷歌旗舰Gemini Robotics模型的表现,但仍远超之前最好的离线模型。在分布式任务和复杂多步骤指令方面,该模型也优于其他设备端替代方案。

面对家中无数形状、大小、颜色和纹理各异的物品,机器人需要能够按需产生智能的新行为,尤其是对于那些从未见过的物体。机器人技术的一大挑战在于,举一反三并非易事。而Gemini Robotics On-Device模型通过50到100次演示即可快速适应新任务,展现了其强大的新任务适应能力。

谷歌还展示了这一性能在实际应用中的效果,将其调整并应用到了双臂Franka FR3机器人和Apptronik的Apollo人形机器人上。在Franka机器人上,该模型能够执行通用指令,处理以前未见过的物体和场景,完成包括折叠衣服在内的灵巧任务,以及需要精确度和灵巧性的工业皮带组装任务。在Apollo人形机器人上,通用模型同样能够遵循自然语言指令,以通用的方式操控不同的物体,包括之前从未见过的物体。

这一系列创新引发了网友的热烈讨论。有人认为,谷歌的脱机AI机器人具有改变游戏规则的可能性。然而,也有人提出质疑,询问这与特斯拉机器人的设计有何不同,以及与ylecun在meta所做的工作有何差异。在机器人/具身智能这一赛道上,各家大模型正展现出多样性和丰富性的技术向度,共同指向同一个核心命题——如何让AI在三维物理世界中建立真正的因果认知。

相关内容

热门资讯

宁波朗迪取得网布烫边切割装置专... 金融界2025年8月6日消息,国家知识产权局信息显示,宁波朗迪环境科技有限公司取得一项名为“网布烫边...
富兴塑膜取得PVC塑膜压纹成型... 金融界2025年8月6日消息,国家知识产权局信息显示,苍南县富兴塑膜有限公司取得一项名为“一种PVC...
美国拟2030年前在月球建成核... △艺术家描绘的月球上的电力系统。(图片来源:NASA) 当地时间8月5日,据多家美国媒体报道,美国交...
TTG3-1KSG,清清正反手... TTG3-1战胜KSG,终于结束了对KSG的连败。从EWC回来之后他们似乎变强了,清清证明了为什么萝...
中国电信视联网赋能基层治理 提... 近日,丰都县仁沙镇依托中国电信视联网技术,进一步提升基层治理智能化水平,推动乡村基层治理体系不断完善...
《上古OL》开发商被砍掉的《黑... 微软最近的大裁员砍掉了《上古卷轴OL》开发商备受期待的新IP(代号为黑鸟计划)以及Rare工作室的《...
山东科嘉电气:高效智能充电方案... 山东科嘉电气近日推出了两款创新充电设备,专为不同领域提供专业、高效、安全的充电解决方案。这些设备分别...
科技前沿丨普通家庭何时能用上保... 7月31日召开的国务院常务会议审议通过《关于深入实施“人工智能+”行动的意见》。会议指出,当前人工智...
泰科汽车取得油箱加油单向阀专利... 金融界2025年8月6日消息,国家知识产权局信息显示,芜湖泰科汽车科技有限公司取得一项名为“一种油箱...
当年吹爆Edge浏览器的我,现... 每位资深玩家,在对枪失败、团战暴毙后,都有一套神圣的仪式: “诶今天鼠标有点飘”、“这键盘键程不对”...
走出光伏同质化困境,BC生态圈... 来源:澎湃新闻 隆基绿能创始人、首席技术官李振国 同质化的红海厮杀,令光伏产业深陷恶性竞争泥潭。乘...
AL被打晕了?IG辅助抢大龙翻... ★游戏马蹄铁原创 AL对战IG第二局 IG无愧是现在LPL的人气王,流量王,他们的比赛不仅是明星选...
LOL:BLG被曝不是全华班,... Shadow护照是意大利的 在LPL赛区中,全华班自带流量和话题,像RNG、BLG这种主打全华班的...
紧盯AI人才,“鹅厂”招新,软... 8月6日,腾讯2026校园招聘正式启动。本次招聘面向2025年1月至2026年12月期间毕业的大学生...
DOTA2 7.39d 更新深... 当看到 7.39d 的更新日志时,我的第一反应是:这不是简单的数值微调,而是V社对当前版本生态的一次...
《仁王3》制作人访谈:保留硬核... 今年6月,《仁王3》发布了首支预告片,并宣布游戏将于明年年初正式发售,登陆PlayStation 5...
青春好市 | 以手抵心,对话千... 当棕榈叶在指尖翻飞成灵兽,当大漆在掌心打磨出光华,当破碎的古瓷片在你手中重获新生...这不是遥远的传...
IDC:Q2中国消费级游戏本市... IT之家 8 月 6 日消息,市场研究机构 IDC 今天发文,披露了中国消费级游戏 PC 市场的数据...
小米手机欧洲市场份额首超苹果,... 【太平洋科技快讯】8 月 6 日,小米集团合伙人、小米集团总裁、部总裁兼小米品牌总经理卢伟冰在社交媒...
王者荣耀:夏侯惇喜迎加强,亚连... 王者荣耀本赛季已经进入中期,还没有拿到王者印记的小伙伴确实该抓紧时间了,毕竟到了赛季后半段上分难度会...