具身智能狂热之下,智源研究院如何入局生态搭建?
创始人
2025-11-21 11:42:16
0

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

在人工智能领域焦点从大语言模型转向具身智能的背景下,智源研究院在11月20日举行的开放日上释放出其最新的技术与生态布局。

智源研究院指出,当前具身智能仍停留在“可演示但难规模化”的阶段。尽管机器人硬件快速成熟,但模型不好用、不通用、不易用的瓶颈依然存在,不同本体之间缺少统一接口,动作规划与控制难迁移,部署成本高企。

为解决这些结构性问题,智源展示了一套自底向上构建的通用技术体系,以具身大脑为核心,将数据采集、标准化工具链、模型基座、仿真与评测整合为一个统一架构,并以开源开放方式维持其演化。智源表示在具身领域的合作伙伴已超过30家,规模仍在扩大。

在模型层面,智源发布了新一代的RoboBrain 2.0 Pro,通过引入价值判断与三维空间追踪两大能力,使机器人能在复杂场景中进行更稳健的动作推理。

基于此构建的RoboBrain-X0 Pro支持零样本跨本体迁移和长程多步骤操作,而面向灵巧手的RoboBrain-Dex则通过大规模人类示范的预训练,显著降低灵巧操作的数据门槛。在基础控制方面,智源推出贯通仿真到真机的Emu-RobotVerse以及专为人形机器人打造的全身控制框架BAAI Thor,为人形机器人在强交互任务中的稳定性提供底层支撑。

此外,智源还推出了围绕人机交互、响应延迟约80毫秒的全双工语音大模型RoboBrain-Audio,以及聚焦长期记忆与社会认知的RoboBrain-Memory。

图源:智源研究院

在技术路线讨论中,现场的圆桌对话围绕端到端VLA、分层式模型以及世界模型三种路径展开辩论。共识是短期内分层架构仍更适合工程落地,而通用基座模型将在更长周期内成为行业目标,其前提在于统一的场景表示、高质量的数据闭环和一致的评测体系。

关于“硬件是否拖累模型”的争议也有了更多答案,行业认为模型规划与硬件执行已进入互相重塑的阶段,尤其在力控、人形结构和安全边界等方面,双方必须共同定义标准。

在具身智能的讨论中,数据从哪里来、够不够用、能否逼近通用能力,成为行业最受关注的话题之一。智源研究院院长王仲远在接受界面新闻等媒体采访时,也同样被问及大量相关问题。

例如,在训练具身模型时,视频、真机数据与仿真数据究竟如何分工;视频能否承担最主要的学习负荷;真实机器人数据是否存在“规模上限”;以及在缺乏触觉和力控信息的情况下,行业如何避免模型能力被视觉单模态限制等等。

这些问题共同指向一个焦点——具身智能的训练到底依赖怎样的数据结构,行业今天到底处于什么阶段?

王仲远对此一一给出解答,他指出,机器人世界与语言模型完全不同,短期内不可能出现像互联网文本那样爆炸式增长的海量真机数据。即便未来部署一千甚至一万台机器人,也远不足以撑起通用模型所需的规模。

规模化数据肯定是有价值有意义的,但我自己认为即使是几十万小时的数据依然不能叫海量数据,还远没到ChatGPT时刻。”王仲远说。

在这种结构性限制下,智源选择遵循“第一性原理”:以视频作为训练的主输入。王仲远认为视频不仅具备可规模化采集的优势,还同时包含时空因果、语义、图像、动作、声音以及部分三维线索,是当下最完备、最现实、也最接近人类学习路径的数据来源。

在智源看来,人类通过视觉建立对世界的认知再自然不过,一个两岁小女孩通过刷短视频学会拆糖果与拧瓶盖,就是对这种学习机理的直观印证。

在这个框架中,机器人通过少量真实操作记录,获得任务成功与失败的因果反馈,再通过强化学习修正行为策略。这种方式无法替代海量视频,但可以在关键动作上提供必要的纠偏,使模型具备实际落地的可执行性。

至于视频模态数据在触觉与力控上的天然局限,王仲远坦言目前行业整体都缺乏足够规模的力反馈数据,但他表示智源非常认可这类数据在未来发展中的重要性。

此外,在具身智能的集体狂热中,外界最关心的问题也指向另一个核心,即资金为何突然加速涌入、行业到底在争什么?

王仲远对界面新闻等媒体解释称,融资潮并非偶然,而是共识驱动的结果。当前,资本、政策和产业圈普遍相信具身智能将成为下一条长周期技术曲线,类似当年大模型真正进入产业化的时刻。

一旦共识形成,资源便会迅速集中,而具身研发本身又是典型的“重资本、长周期”项目,算力、硬件和大规模场景验证都需要持续投入,这使得高额融资几乎成为入场门槛。“在我看来这肯定是一件好事,因为它能够加速整个产业的聚集。

但在热度背后,王仲远坦言资本同样有自己的焦虑。当前商业化路径仍未跑通,不同技术路线尚未收敛,投资人也可能被情绪驱动进入赛道。他认为,行业未来仍会经历周期波动,但技术演进会继续沿着螺旋上升的轨迹前行。

至于创业生态,他的判断更为现实。具身创业公司快速出现,也快速倒下,多半因为商业模式不清晰或资源分散。王仲远强调真正的竞争力来自“把一个真实场景打磨到可长期使用”,而不是追求做一个“万能具身”。

我跟创始人经常聊的一句话是,先活下来,熬过可能出现的寒冬才能迎来真正具身智能的未来。”王仲远说。

相关内容

热门资讯

影石“连麦”腾讯背后:AI硬件... 来源:新京报 当下,一场看似无序的AI硬件跨界潮正在上演:阿里做AI眼镜,影石做无人机,大疆做扫地机...
深圳前海发布四大领域场景 科技日报讯(记者罗云鹏)记者12月15日获悉,在日前举办的2025前海·宝安“宝景创享”场景对接大会...
迈向自动驾驶:地平线技术生态大... 时代奔涌,风聚成潮。中国智能驾驶产业在经历了技术验证与场景探索后,正步入以“规模化商用”为核心命题的...
丝芭传媒回应鞠婧祎待遇和收入:... 12月16日,上海丝芭文化传媒集团有限公司官方微博@丝芭传媒发布“关于我司艺人鞠婧祎的事实阐述和声明...
原创 将... 前段时间,我们有个朋友在直播电商这个领域做了5年。他最近突然跟我们说,想转向做内容创作和电商的结合,...
2亿像素背后,藏着什么代价?厂... 在开头,我只想问一下各位小伙伴,你有没有这样的经历,平时去喜欢看演唱会或者某体育项目的赛事,如果有,...
一堂商学院的AI智能体课程纪实... 出品|虎嗅科技组 作者|陈伊凡 编辑|苗正卿 头图|中欧商学院提供 2025年12月12日,中欧国际...
《失落星船:马拉松》将于202... IT之家 12 月 17 日消息,索尼旗下游戏开发工作室 Bungie 在经历版权风波等事件后,本周...
豪威科技推出专为智能眼镜打造的... IT之家 12 月 17 日消息,半导体技术研发企业豪威科技(OMNIVISION)推出了业内首款单...
成都商业航天补全关键一环 转自:成都日报锦观 成都商业航天补全关键一环 此次配套“东坡之眼号”,卫星制造与核心分系统,在都市圈...
女报评论|祛AI魔改之“魔”,... AI技术衍生出的网络乱象,不断变换花样泛起。近两年,诸多视频平台兴起一阵AI“魔改”风。从《甄嬛传》...
小学生沉迷“刷赞当大佬”,每天... 儿童电话手表已成为未成年人数字社交圈的载体。电话手表的功能不断迭代,早已突破“定位+通话”的核心功能...
哪个品牌的吸尘器好?小型吸尘器... 不想做太多功课也没关系。我把十几台热门吸尘器都试过,把表现最稳的挑成这一份闭眼清单。每台都实际测了吸...
天基算力竞速赛:突破能源与带宽... 慧博投研近日发布研究报告,对太空算力这一前沿领域进行深度梳理。报告指出,太空算力指将数据处理与计算设...
小米:已拥有S级短剧1000部... 观点网讯:12月17日,小米互联网业务部总经理刘婵公开表示,小米互联网已构筑起真正意义上的全局生态,...
曝一加Turbo配备全新165... 【CNMO科技消息】12月17日,数码博主爆料称,一加即将推出的全新Turbo系列将打破传统“Tur...
徕芬i2电动牙刷:老用户7折换... 作为一名徕芬第一代电动牙刷的早期用户,我曾是这个国产新锐品牌的支持者。然而,当品牌推出第二代i2并打...
我国侵入式脑机接口临床试验取得... 12月17日,中国科学院脑科学与智能技术卓越创新中心发布该中心与国内科研机构及医疗单位合作开展的第二...
一次让轴组件“重生”的质量效率... 来源:滚动播报 (来源:中国航空报) 张博欣 在航空工业华燕精密制造中心的研磨间里,王松平盯着手...
存储成本上涨致中端设备涨价 头... 2025-12-16 15:01:39 作者:狼叫兽 此前有消息指出,部分在售的小米平板产品已出现...