谷歌AI获IMO“唯一金牌”,硅谷夹道祝贺,奥特曼丢人又丢人
创始人
2025-07-22 09:27:16
0

去年三天摘银,今年4.5小时夺金,DeepMind的数学成绩可以说是突飞猛进。

除了DeepMind CEO哈萨比斯、谷歌CEO劈柴哥给团队发来贺电,马斯克也发推表示了祝贺。

DeepMind这波可谓是被各界夹道祝贺,做得体面又周到。

但DeepMind被夸得越好,OpenAI就越发相形见绌,同样是AI参赛IMO,秘密搞事情也就算了,还为了营销跟人类青少年抢风头。

奥特曼治下的OpenAI,最近除了丢人就丢人了。

DeepMind官宣AI拿下IMO金牌

DeepMind公告显示,Gemini新模型做对了今年IMO六道题中的五道,获得了35分。

并且这一成绩,也 获得了IMO主席Gregor Dolinar的亲自认证

我们可以确认,谷歌DeepMind已达到人们梦寐以求的里程碑,获得了35分(满分42分)——堪称金牌。

他们的解决方案在很多方面都令人惊叹。IMO评分员认为这些解决方案清晰、精准,而且大多数都易于理解。

不仅评分遵循IMO未公开的规则,所用时间标准也和人类选手完全一致——4.5小时之内答完交卷。

而去年DeepMind的银牌成绩,是用AlphaProof和AlphaGeometry一起做了三天才获得的。

这次不仅用时更短,答题过程也是 全程自然语言、端到端完成,不再像去年那样专门修改题目格式。

DeepMind高级科学家兼IMO团队负责人Thang Luong表示,这与去年相比是一个范式转变。

此外,DeepMind研究员、布朗大学教授Junehyuk Jung介绍,在今年的第三题中,很多人类选手使用了研究生水平的方案(IMO为高中竞赛),但Gemini 仅使用了初等数论知识就给出了自洽的证明

Jung还表示,Gemini没答对的最后一题,是一开始方向就错了,不过人类选手中做对这道题的也只有五个人。

顺便说一下,谷歌已经将Gemini做对的五道题的答案完整公开(链接见文末),有兴趣的话可以验证一下~

这次DeepMind用来参赛的,是一款暂未公开的全新模型,搭载了Deep Think推理模式。

DeepMind介绍,Gemini Deep Think是一种针对复杂问题的增强型推理模式,融合了其最新的一些研究技术,包括 并行思维

这种模式使模型能够同时探索并组合多种可能的解决方案,最终得出最终答案,而不是追求单一的线性思维链。

为了充分利用Deep Think的推理能力,DeepMind额外训练了 Gemini 的这一版本,使其能够利用更多多步推理、问题求解和定理证明数据。

此外DeepMind还为Gemini提供了精选的高质量数学题库,并在其指令中添加了一些关于如何解答IMO题目的通用提示和技巧。

当然,DeepMind今天的官宣,也是获得了各种称赞。

DeepMind宣布成绩,被硅谷夹道欢迎

包括来自友商的称赞在内,DeepMind获得了整个硅谷的夹道欢迎。

除了开头马斯克那句简单的Congrats之外,还有Meta AI科学家称赞Gemini给出了清晰、精准、非常适合自学的解决方案。

受欢迎的原因,不仅是表现优秀,也包括谷歌对IMO规则的尊重。

Gemini参加挑战是受到了IMO官方邀请,所有规则标准都和人类一致。

并且,DeepMind也遵守了IMO官方的要求,没有急于宣布结果。

仔细研究哈萨比斯的推文,只字未提OpenAI,但又处处在针对OpenAI。

哈萨比斯的三条回复,主要强调了这么几点: 官宣是没有抢跑的,成绩是IMO认证的,模型也是未来可用的。

这三点,刚好和抢先宣布夺金结果被锤的OpenAI形成了鲜明对比。

IMO评审团和协调员们普遍认为,AI开发商在IMO期间(尤其是闭幕式之前)宣布成绩是“粗鲁且不恰当的”。

除了公告发布时间的问题, OpenAI到底得没得金牌也有争议

领导DeepMind超级推理团队的Thang Luong补充,IMO内部其实有一份官方评分指南,外部无法获取。没有基于该指南的评分就没有资格获得奖牌。

这届IMO共6道题,每题7分。金牌线35分,OpenAI自报的成绩也刚刚过线,即使是解答过程中微小的扣分都可能让OpenAI从金牌跌到银牌。

有网友评价:OpenAI一如既往的为了炒作什么都干得出来。没有官方分数,没有耐心,也没有羞耻心。

此外,OpenAI参赛用的模型也是未公开版本,并且可能以后也不会公开。

总之是处处和谷歌对比鲜明。

OpenAI研究员回应质疑

针对以上这些质疑,OpenAI研究员Noam在给谷歌送出祝福后,也顺带进行了回应:

首先,Noam解释OpenAI没和IMO官方合作 不是没收到邀请,而是OpenAI自己拒绝了。

其次是关于作答过程和评分的权威性,Noam表示没有使用RAG或者任何工具,而 打分是由3位IMO获奖者给出的

同时Noam还公开了OpenAI模型的回答,表示任何人都可以检查。

最后是关于宣发时间,Noam表示公布成绩之前 和IMO董事会成员进行过沟通,后者要求等到颁奖仪式之后再发布,OpenAI表示接受。

而OpenAI官宣的时间是在太平洋时间凌晨1点,彼时颁奖已经结束, OpenAI没有被要求需要等到更晚的时间再发布

虽然Noam的解释获得了部分网友的认可,但说一千道一万,网友还是表示倾向于站在谷歌这一边。

总之最近的OpenAI,除了丢人还是丢人。

小扎磨刀霍霍,人丢了。

谷歌同场竞技,丢人了。

Gemini回答:

https://storage.googleapis.com/deepmind-media/gemini/IMO_2025.pdf

OpenAI回答:

https://github.com/aw31/openai-imo-2025-proofs/

参考链接:

[1]https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/

[2]https://arstechnica.com/ai/2025/07/google-deepmind-earns-gold-in-international-math-olympiad-with-new-gemini-ai/

相关内容

热门资讯

米哈游《原神》冲上热搜,上线近... 7月22日,米哈游旗下开放世界冒险游戏《原神》发布短片《月夜的叙事诗》,围绕全新区域挪德卡莱,展示了...
体验飞利浦27B2W5600:... 当电视不再是现代家庭唯一的娱乐中心入口时,种类繁多的显示设备所带来的差异化体验就更加凸显出来。尤其是...
新技术为心脏移植供体短缺解困 来源:滚动播报 科技日报讯 (记者张梦然 实习生周思彤)新一期《新英格兰医学杂志》发表两篇论文显示,...
星际访客3I/ATLAS飞入太... 2025-07-22 14:40:56 作者:狼叫兽 近日,一颗编号为3I / ATLAS的“星...
世界人工智能大会“AI+媒体”... 世界人工智能大会“AI+媒体”专业论坛7月27日举行 从“融”到“智”助力系统性变革 由上海报业集团...
安克创新取得立式拓展坞专利,提... 金融界2025年7月22日消息,国家知识产权局信息显示,安克创新科技股份有限公司取得一项名为“立式拓...
原创 国... 《魔兽世界》正式服第二赛季还剩下两周的时间,很多玩家早已结束大秘境之旅,跑去刷坐骑了。但始终有一批狂...
《战地6》开放测试即将启动 双... EA通过官方推特确认《战地6》将开启公开测试,此前该作已进行长达五个月的封闭测试。据Reddit用户...
《经济学人》感慨:苹果折戟之地... 【文/观察者网 阮佳琪】 2024年2月底,美国苹果公司突然宣布,彻底放弃历时十年的自动驾驶汽车“...
频率可调式超声波焊接发生器 频率可调式超声波焊接发生器的核心优势在于其出色的适应性与精确控制能力。随着工业领域对焊接精度和材料兼...
九科信息入选2025“种子独角... 7月17日至18日,以“新质驱动・未来领航”为主题的中国(深圳)独角兽企业大会在深圳盛大举行。这场年...
Omdia:预计至2029年亚... 智通财经获悉,Omdia最新报告指出,尽管免费游戏(F2P)占据绝对主导地位,但订阅模式在亚洲游戏市...
东华科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示东华科技(002140)新获得一项实用新型专利授权,专利名为“...
英码科技亮相昇腾AI开发者创享... 7月18日,昇腾 AI 开发者创享日・广东站在广州举行,以‘创未来 享非凡’为主题聚焦昇腾生态落地实...
火星探秘:红色星球上的尘暴与尘... 在浩瀚的宇宙中,火星,这颗被人类视为潜在第二家园的红色星球,一直激发着我们的无限遐想与探索欲。然而,...
郑州联通客户日:科技赋能智慧生... 来源:郑州大民生 近日,郑州联通以“联通客户日 融合新生态”为主题,通过“科技体验+便民服务+民生对...
国产手办卖爆,日本人大呼“看不... “没啥具体用途,精品级的一个要卖千把块钱,手办的走红其实是件不太符合商业逻辑的事,但整个市场现在非常...
上线送法器!魔域口袋版新职业登... 7月25日,全新版本“玄天御阵”即将震撼上线,本次更新将带来一位全新职业——太乙阵师,还有令人心动的...
“左手”揽大单 “右手”融巨资 众擎机器人。 (受访企业供图) 深圳商报首席记者 袁静娴 正当外界讨论人形机器人赛道是否进入“降温期...
杭科光电取得内设线性光源的灯专... 金融界2025年7月22日消息,国家知识产权局信息显示,杭州杭科光电集团股份有限公司取得一项名为“一...