“作为人工智能领域的前沿热点,具身智能在CES之后热度持续攀升,其核心要义在于将智能能力与实体设备深度融合,通过感知-决策-执行-反馈的完整闭环,实现对物理世界的主动改造。”近日,英特尔研究院副总裁、英特尔中国研究院院长宋继强系统解读了具身智能技术的最新进展、核心挑战与产业落地路径。
据他解释,具身智能的核心特征在于物理闭环与主动交互,区别于单纯的信息处理类AI应用。无论是智能车的位移运输、机器人的现场操控,还是无人机的任务执行,其本质都是通过执行器产生物理改变,并依据环境反馈优化后续决策。这种特性决定了具身智能必须面对多样化的场景需求:工业场景对可靠性与精度要求严苛,消费场景注重功耗与成本平衡,商用场景则追求灵活适配与快速响应。单一硬件架构难以覆盖所有需求,异构计算因此成为技术基石——通过CPU、GPU、NPU、AI ASIC等不同计算单元的协同,匹配感知、决策、执行等不同环节的差异化需求,实现能效比与性能的最优平衡。
在应用架构层面,具身智能正从传统的预编程模式转向多智能体自主协作模式。这种变革意味着系统需根据用户需求、业务变化和场景动态,自主构建业务流并生成专用智能体。智能体本身由多种AI组件构成,涵盖扩散模型、大语言模型(LLM)、视觉语言模型(VLM)等,不同组件的计算内核、数据量级与并行度差异显著。为此,英特尔提出混合编排层架构,通过统一的系统基础设施隔离硬件多样性,向上提供稳定的软件接口,使上层业务编程成本长期有效,同时支持多厂商、多架构的灵活组合,适配开放生态的演进需求。
宋继强称,针对具身机器人这一核心应用载体,行业尚未形成统一的最优技术路径。当前主流探索方向是混合异构框架,融合前沿AI模型与传统运动控制技术。英特尔将这一链路拆解为“系统2-系统1-系统0”三级架构:系统2作为慢系统,通过VLM等大模型实现视觉理解与任务规划,输出高精度语义级结果;系统1(Action Expert)将规划任务映射为设备执行器的控制指令,兼顾实时性与设备适配性;系统0则通过传统的模型预测控制(MPC)技术,将控制频率提升至1000Hz级别,确保运动的平滑与精准。三者分别对应GPU、NPU、CPU的异构计算优势,形成各司其职的协同体系。
硬件产品方面,英特尔最新发布的第三代酷睿Ultra For Edge处理器成为关键支撑。该产品专为工业级应用与物理AI设计,具备180 TOPS的AI算力,采用Intel 18A制程工艺,在能效比上实现显著提升。其核心优势在于工业级可靠性,包括宽温工作范围、10年稳定供货周期,以及针对机器人场景优化的高实时性与确定性。配合英特尔机器人AI套件与具身智能SDK,形成从硬件到软件的完整解决方案——前者提供模块化的参考设计与优化软件包,支持传统视觉模型与大模型(含VLA)的高效运行;后者新增LLM任务规划、EtherCAT实时通信等关键能力,复用英特尔在工业机器人领域的成熟技术积累,大幅降低厂商开发成本。
宋继强认为,可信赖性是具身智能从实验室走向产业落地的核心瓶颈,英特尔从决策、执行、故障应对三个维度构建了全方位保障体系。在决策层面,采用神经符号AI混合控制模式,将领域知识与规则嵌入系统,对神经网络生成的决策进行校验,既发挥大模型的泛化能力,又避免幻觉导致的灾难性后果。在执行安全层面,借鉴汽车行业的安全设计思路,构建“主控系统-安全系统-备用系统”三级硬件架构:安全系统持续监控传感器输入与执行器状态,预判潜在风险;备用系统在故障发生时,能将机器人引导至最小风险状态,而非简单停机。基于这一理念,英特尔联合学界与产业界发布《具身智能机器人安全子系统白皮书》,提出PMDF(监控-决策-故障处理-恢复)框架,为行业提供标准化的安全设计参考。
谈及产业落地前景,宋继强指出,当前具身智能正处于“提升能力上限”向“筑牢可靠性底线”的关键过渡阶段。物流分拣、工厂备料搬运、标准化产品组装等半结构化场景将率先实现商用落地,这些场景任务明确、领域知识清晰,能够在现有技术条件下实现可靠运行。预计一两年内,部分厂商将在实际工厂中部署具身智能机器人,但要实现百万台级别的工业规模应用,仍需突破量产一致性、成本控制、数据标准化等多重挑战。
数据问题是当前具身智能发展的重要制约因素。宋继强指出,由于场景多样性、机器人本体差异、精度要求不统一等原因,数据孤岛现象突出,行业尚未形成统一的数据采集与训练标准。英特尔认为,数据标准化需要在实践中逐步推进,而当前阶段,通过构建开放生态、推动数据交易等方式,可在一定程度上缓解数据荒问题。同时,随着产业规模扩大,依托成熟工业体系(如车企)提升零部件量产能力,将有效降低硬件成本,推动具身智能向更广泛的商用场景渗透。