对话朱松纯:中国的AI叙事关乎国运
创始人
2025-04-18 21:20:50
0

出品|搜狐科技

作者|杨锦

在大模型的热闹之外,朱松纯不惧做一个少数派。

他认为,科学本质是用简约的模型解释复杂的现象,比如杨振宁、爱因斯坦这些科学家,他们构建世界的模型里可能只有一两个参数。而今天的大模型,动辄百亿甚至千亿级的参数,还不可解释,“从这个角度看,确实是非常丑陋的。”

但他也承认,从工程的角度来讲,大模型又能够在某些方面产生比较好的结果。

他和北京通用人工智能研究院(通研院)及北大几位老师最新合编的图书《通用人工智能标准、评级、测试与架构》,针对通用人工智能提出了系统的标准、评级、测试与架构体系,对大模型也适用。

什么是智能?怎么样才算是通用了?在这套评测体系下,智能体不仅要完成任务,还需要自主定义任务,这意味着,智能体没办法像在其他评测体系上一样“刷榜”。

过去20年,刷榜像附着在人工智能发展史上的藤壶,他本人也曾长时间地站在数据驱动和刷榜的一线。2004年,朱松纯和另一位全球计算机领域顶级科学家沈向洋,在他的湖北家乡创建了莲花山研究院,是最早规模性地做大数据标注的机构。

刷榜是针对性地做端到端训练,而通用泛化的任务,是一个无穷的任务,比如训练机器人学会抓杯子,这很快,但问题是,稍微换个位置、改个重量、变个尺寸,它又不认识了。

打掉无数个榜单之后,他开始觉得,这是一个“任务陷阱”。这个路,可能是走不通的。

朱松纯目前担任北京通用人工智能研究院院长,北京大学人工智能研究院、智能学院院长。

作为国际知名的计算机专家、统计与应用数学家、人工智能专家,朱松纯曾在国际顶级期刊和会议上发表论文300多篇,解决了“什么是纹理”的底层科学问题。又分别在31岁、35岁和39岁的时候,三次问鼎计算机视觉领域最具声望的马尔奖。

一个登过顶的人,在遍览众山小后,从山上走了下来,不再爬山、更不想爬树。他想登月了。

2017年,朱松纯提出了“小数据、大任务”范式,核心是“给机器立心”,让智能体可以自主性地构建物理的感知,因为这是在数据中看不见的。

在这个理论体系下,通研院训练出了由价值、因果驱动的智能体“通通”,只用了10张显卡。整个通研院,也只有一两百张卡。

到今年,“通通”的智商和情商相当于一个五岁左右的小女孩,能够在一定程度上理解周围环境,有自己的个性,会耍赖、撒谎。

来源于《通用人工智能标准、评级、测试与架构》

相比之下,在一些测试中,大模型能通过人类司法考试,在数学、编程、法律等学科的表现接近人类博士平均分,在医学考试中的正确率能够超过大多数医学博士考生,看起来似乎厉害多了。

但朱松纯认为,AI会解几何题、能打螺丝,这些是专业能力,不是通用、泛化的能力。做出来的答案,可能是蒙的,也可能是刷题或者死记硬背的。有着认知架构的通用智能体,可能现在幼稚,却有自主性和成长性。

他一再呼吁,中国要形成自己的AI叙事,不能一味地跟随硅谷的模式,堆算力、堆数据,要找到一条自己的路线,做原创性的研究。

“我们要非常严肃认真地对待通用人工智能的问题,它不是一个只是炒作的热点话题。真正的通用人工智能还没有起来,还需要接着投入,这是真正关乎到我们国运的选择。”

以下为对话精编:

搜狐科技:注意到您对大模型的态度似乎有一些变化。之前在杨振宁先生百年诞辰活动上,您曾说大模型是非常丑陋的,很难通向AGI,但是您最新主编的这本通用人工智能的测试标准书,把大模型也覆盖进来了,另外通研院也开始在大模型上构建通用智能体的认知和决策体系,这个转变的契机是什么?

朱松纯:当时是谈科学的美,因为对于科学的美来说,整个理性的科学从20世纪黄金和白银时期,你看杨振宁、爱因斯坦这些人,他们构建世界的模型里面可能就只有一两个参数,咱们现在的模型可能几十亿甚至上千亿个参数。

物理模型要解释那么复杂的现象,它只有几个参数或者一个参数,从科学的角度来讲,大道至简,用越简约的模型来解释越来越复杂的现象,这是科学的本质。

大模型不光参数太大,还解释不清楚。搞深度学习的人都不清楚那个模型里面到底是个啥东西,没人能解释,Transformer这里面的表达也是完全无法解释的,所以从这个意义上讲,它肯定是很丑陋的。

但是从工程的角度来讲,它又能够产生比较好的结果,这一点我们不能不承认。

搜狐科技:为什么要把大模型纳为评测目标?目前中美头部大模型的测试结果怎么样?

朱松纯:肯定是要把它作为其中的一种智能系统,因为我们要把所有(种类)智能体都要放进来测,有的是它能够刷一个功能,有的刷很多功能。有的没有具身,我们就给它配个目前最好的身体给它测,从测出来的结果来看,效果确实是不太好的。

搜狐科技:您之前提得比较多的是UV函数,然后您今天讲CUV,这个C是指什么?

朱松纯:就是它的认知架构,它脑袋的复杂度有多大。比如说有一个图像,每个人看的东西都不一样是吧?假设我把人所有能看到的东西综合起来,那就是人的认知的极限了,有可能未来机器看到的比所有的人看到的还多。

这就是C,认知架构,它的英语是“Cognitive Architecture”。我们说C的进化,就是指它能够看到越来越多的节点了。

搜狐科技:对我们小数据、大任务的范式,外界似乎也有一些质疑。

朱松纯:有人说,是不是因为科学的方式在转换,你们是不是掉队了?也有人说你们是不是思想保守?如果数据是一个表层的现象,它是被里面的一些核心的诉求所驱动的怎么说话、怎么做事呢,如果你去拟合表层的东西,你就要很多参数,因为你是去拟合很高维的空间,但是如果你搞清楚了它底层的诉求,你就可以解释很多现象。

这就是我们说的要追求一个简化的模型,这也是为什么我们提CUV架构,我们还是希望不断地追求美和简约。

搜狐科技:您听到这种声音会生气吗?

朱松纯:根本就不需要生气,每个人的出发点都不一样,大部分对这个东西质疑的人,就是属于那种做实验刷榜刷惯的人。

我们刷榜刷了20年了,在20年过程中,已经形成了一个思维定势和习惯。就是说你给我拿一个代码,在哪个数据上让我测一下,试一下能不能work,这就是一种典型的思维。我就感觉很好笑。

相关内容

热门资讯

《生化危机:安魂曲》两种体验:... IT之家 1 月 16 日消息,在昨日(1 月 15 日)举办的展示会上,卡普空(Capcom)总监...
原创 联... 大家好我是指尖,提到联动皮肤,我想每个玩家都会下意识把这些皮肤的质量在心中拔高一个层级,因为双IP联...
太仓金戈机械取得零配件生产用打... 国家知识产权局信息显示,太仓金戈机械有限公司取得一项名为“一种零配件生产用打磨装置”的专利,授权公告...
《三国:谋定天下》台港澳上市发... 文 | 螳螂观察 作者 | 宏一 最近几年,中国游戏出海取得了不错的商业成就。中国音数协游戏工委《2...
曼晨传动取得回转支承双层密封结... 国家知识产权局信息显示,江苏曼晨传动科技有限公司取得一项名为“一种回转支承双层密封结构”的专利,授权...
我国穿越者壹号载人飞船试验舱着... IT之家 1 月 15 日消息,据穿越者官方公众号今日分享,2026 年 1 月 12 日凌晨,北京...
《辐射:伦敦》mod开发者称贝... 知名《辐射4》mod《辐射:伦敦》开发团队FOLON首席开发者迪恩·卡特(Dean Carter)称...
一批优质企业近期接连落户桃浦智... 近期,上海电信北区局、城建信息科技、创业慧康、图湃医疗、中数泓瑜能源科技、凌云天博光电等一批涵盖数智...
为了万亿美元薪酬!马斯克取消F... 但作为行业龙头,特斯拉此举究竟意在何为?难道不担心此举会带来负面影响吗?而且,面对特斯拉的激进变革,...
泸州增材制造赛道的“链”式突围 在全球制造业竞争格局重塑的背景下,向产业链、价值链高端攀升成为城市高质量发展的关键。四川泸州,正以增...
原创 版... 大家好我是指尖,赛季初期,国服英雄的战力分布情况是怎样的呢?一起来跟着指尖的视角来看看吧,本文聊聊发...
原创 童... 童锦程私生子事件还没结束,白富美正牌女友被曝光,已经怀孕8个月,2026年刚开年,童锦程这条线就像被...
从示范到运营,国内自动驾驶驶入... 2025年,中国自动驾驶产业正迈过技术验证与早期示范的节点,驶向规模化商业运营的深水区。在这一进程中...
原创 知... 知名LOL选手被举报,多位女性指控被他X骚扰,官方将他永久禁赛,巴西赛区再次被推上舆论风口,这一次的...
《传奇M》上线国服,现在的中国... 1月13日,《传奇M:暮光双龙》正式登陆中国大陆市场。作为韩国娱美德(Wemade)旗下“传奇”IP...
“人工智能+”加速提升传统产业 来源:经济日报 2025年以来,我国数字经济发展从“互联网+”的广泛连接阶段,迈向“人工智能+”的创...
S42对抗路出现超模英雄,胜率... S42对抗路出现超模英雄,胜率不断上升,吕布被打到不敢出塔,在王者荣耀里,对抗路一直是最容易“滚雪球...
原创 I... 各位LPL的观众和英雄联盟召唤师大家好,这里是天下游戏汇。 LPL在昨天进行了登峰组第二个比赛日的较...
亿迅取得环带喷砂装置专利,可满... 国家知识产权局信息显示,亿迅(台山)金属制品有限公司取得一项名为“一种环带喷砂装置”的专利,授权公告...
《魔兽世界》周年服:1月15日... 《魔兽世界》周年服已更新至TBC前夕,暴雪在1月15日发布热修补丁,恢复58级直升服务,开启竞技场练...