图灵测试过时了!奥特曼与量子计算之父提出的2.0来了
创始人
2025-11-14 17:41:53
0

新智元报道

编辑:艾伦

【新智元导读】 随着现在的主流大模型都能轻松通过图灵测试,这个持续了数十年的标准开始逐渐过时。奥特曼和量子计算之父David Deutsch讨论得出了一个新的图灵测试2.0标准,可以更好地衡量究竟怎样AI才算拥有真正的智能。

在过去的一年里,如果你还在用图灵测试来评判一款大模型是否聪明,那可能已经有点跟不上节奏了。

从GPT-4、Claude 2、Gemini、LLaMA 3开始的这些模型,已经可以轻轻松松在图灵测试中拿到通行证。

有研究者甚至表示:图灵测试已经过时了。

只要模型在网上混得久一点、见多识广一点,就能骗过绝大多数人类评审。

问题是:一台会说话的机器,真的代表它理解你说的话吗?

在最近的Axel Springer颁奖典礼上,奥特曼和量子物理学家David Deutsch正面交锋,提出了一个新标准。

他们的对话中,一个大胆的提议浮出水面——图灵测试2.0。

图灵测试

1950年,图灵在那篇著名论文《计算机器与智能》(Computing Machinery and Intelligence)中设想:如果一台机器能通过文字交流骗过人类评审,让人以为它是另一个人,那么它就具备了智能。

这个标准在七十年前或许非常超前,但在今天的模型面前,已经有些不堪一击。

Claude 2、LLaMA 3也都在类似实验中表现出色,顺利蒙混过关。

也就是说,按照图灵的标准,它们已经可以被认为是「有智能」的了。但这真的够了吗?

图灵测试2.0:

解出量子引力,再讲给我们听

在Axel Springer的颁奖典礼上,主持人提到奥特曼最喜欢的一本书是《无穷的开始:世界进步的本源》,于是主办方搞了个「惊喜连线」——作者David Deutsch出现在大屏幕上。

于是,一场关于AI是否真的「懂得思考」的对谈开始了。

Deutsch的核心观点是:真正的智能,应该能够创造新知识、提出新假设、解决新问题,甚至推翻旧认知。

奥特曼接话抛出了一个假设:

如果某个模型哪天解出了量子引力的问题,并且能清楚地告诉我们它是怎么想的、为啥这么选,那这是不是就能算是真正的智能?

Deutsch回答:是的。

奥特曼点头:「那我也同意用这个标准。」

一拍即合。奥特曼和Deutsch版图灵测试2.0诞生了。

David Deutsch简介

David Deutsch是个很特别的人。

他是量子计算理论的早期提出者之一,1985年就发表了关于「量子图灵机」的论文(Quantum theory, the Church-Turing principle and the universal quantum computer),为之后的量子计算模型打下基础。

但他更出圈的身份,是一位科学哲学布道者。

在《无穷的开始:世界进步的本源》里,他提出一个观点:人类文明的进步,来自于不断创造好解释(good explanations)。

而「好解释」的产生,正是智能的核心。

所以他在那场对谈中,不断强调「解释力」——不仅要得到答案,还要能说清楚它为什么成立。否则只能算是黑箱,不算是真正的理解。

为什么我们需要图灵测试2.0

从一开始,图灵测试就是个伪装游戏。考验的不是AI是否聪明,而是它能不能骗过人类。

但今天的模型越来越会骗了,有时连自己是不是AI都不太确定。

这让图灵测试在某种程度上失去了它的参考价值。

而Deutsch和Altman所设想的版本,更像是一种「创造力测试」——模型是否具备科学研究的能力,是否能提出新理论,是否能自洽地解释自己的推理。

这个标准很高,甚至高到今天所有AI都达不到。

但它至少指向了一个方向:我们真正关心的,不仅仅是机器能不能说得像人,而更重要的是它有没有可能在理解世界这件事上,成为我们的伙伴。

参考资料:

https://www.youtube.com/watch?v=o80PeJ0P1YM

https://www.businessinsider.com/sam-altman-openai-david-deutsch-turing-test-for-agi-2025-9

相关内容

热门资讯

视频丨AI应用加速落地 国产算... 记者了解到,人工智能在制造业、金融、能源、医疗健康等领域的应用加速落地,这对国产算力相关产业链又将带...
在超级App“围剿”中重启销售... 在血雨腥风的生态博弈中,豆包硬是杀出了一条“血路”。 12月18日的火山引擎2025冬季Force原...
阶跃星辰发布全新AI Agen... 12月17日,阶跃星辰升级发布全新的AI Agent系列模型“Step-GUI”,包括云端模型Ste...
货运服务公司跨越速运:以科技创... 来源:滇云发现 在全球物流业加速迈向智能化、数字化的新阶段,科技创新已从“加分项”转变为驱动行业变革...
移动流量卡限速真相,23年移动... 办卡关注 微 信 公 众 号 :找卡乐园 这里是专为你打造的流量卡服务站,既能帮你揭开流量卡市场的各...
省呗用数字技术守护用户,用温度... 作为国内合规运营的金融科技平台,省呗始终秉持“让金融更温暖”的初心,将消费者权益保护视为发展的底层逻...
AI应用比拼赚钱能力的时候到了 深圳商报首席评论员 胡蓉 近日,一款叫“蚂蚁阿福”的AI APP明显加大了市场宣发,频频出现在大众视...
苹果开源SHARP模型 单张2... 【CNMO科技消息】近日,苹果公司发布了一项名为SHARP(Sharp Monocular View...
阿里巴巴与深圳市南山区达成合作... 央广网深圳12月18日消息(记者 孔明 见习记者 陈家辉)12月17日,阿里巴巴与深圳市南山区政府指...
从CSR到ESG,企业如何探路... 12月16日,由南方都市报主办,上海财经大学富国ESG研究院、妙盈科技支持的“2025责任中国·ES...
腾讯向拼多多射了三箭 来源:本原财经 上海法院12368系统更新出两起特殊案件。 原告深圳市腾讯计算机系统有限公司、上海...
氢能时代,铂金科技价值“看涨” 来源:科技日报 继黄金、白银价格大幅拉涨后,有色金属看涨的“接力棒”落在了铂金手上。截至12月17日...
海南自贸港政策红利吸引全球航司... 来源:热点雷达 全球航司扎堆海南修飞机的核心吸引力,源自海南自贸港叠加政策红利形成的"成本洼地"与"...
AI将实现全民高收入:马斯克的... 【CNMO科技】近日,埃隆·马斯克在回复桥水基金创始人雷·达里奥的发言时再次阐述其观点:在AI与机器...
vivo X300系列叫好又叫... 快科技12月18日消息,10月份,vivo正式发布了新一代旗舰vivo X300系列,包括X300和...
“车而优则机器人”,商汤开源开... 新京报贝壳财经讯(记者罗亦丹)12月18日,AI公司商汤旗下的大晓机器人正式发布行业首创的ACE具身...
格力博:智能割草机器人收入增6... 证券之星消息,格力博(301260)12月18日在投资者关系平台上答复投资者关心的问题。 投资者提问...
MiniMax通过港交所上市聆... 12月17日晚,中国证券报·中证金牛座记者从知情人士处获悉,国内AI独角兽公司MiniMax已通过港...
时代电气招标结果:泓慧带货物料... 证券之星消息,根据天眼查APP-财产线索数据整理,株洲中车时代电气股份有限公司12月15日发布《泓慧...
多只卫星相关ETF涨逾3% 12月18日,ETF市场涨跌不一,其中,卫星ETF易方达、卫星ETF、卫星ETF广发、卫星产业ETF...