可“解难题”也可“出好题”!中国科学家取得通用人工智能逻辑推理新突破
创始人
2026-01-26 22:41:32
0

新华社北京1月26日电(记者魏梦佳)中国科研团队近日自主研发出的一款“通矩模型”,该成果26日晚在线发表于国际权威学术期刊《自然-机器智能》。相关专家表示,这是国际首个同时具备自主出题和自动解题双重能力的通用人工智能系统,标志着中国科研团队在自动化推理的逻辑核心领域实现关键技术自研,并在性能与功能多样性上达到国际领先水平。

据了解,长期以来,AI在逻辑推理领域面临着两大核心挑战:一是“组合爆炸”,即几何推理往往需要寻找并添加精妙的辅助线,每增加一个点或圆,搜索空间(即探索模型中所有可能的解决方案)都会呈指数级增长;二是“高质量数据匮乏”,即现有的几何题目库规模较小,难以支持大规模模型的训练。

由北京通用人工智能研究院、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院以及北京大学武汉人工智能研究院组成的联合科研团队,通过开发一套精密的逻辑推理搜索架构,将复杂的几何世界抽象建模,使AI系统能像人类数学家一样,在逻辑推理每个节点上都能进行有序地系统性探索,避免了无效的重复尝试。

据悉,团队创新性地引入了“规范化表示”技术。这套机制赋予了AI一种“识破伪装”的能力:在复杂的几何空间中,同一个命题往往会因为图形的旋转、翻转或缩放而产生无数种表现形式。通矩模型能自动识别并合并这些对称或同构的拓扑结构,将庞杂的搜索空间压缩了几个数量级。例如,无论一个三角形在空间中如何摆放,系统都能精准锁定其本质的几何关系。这种对物理对称性的深度利用,极大地提升了搜索效率。

而在AI寻找解题“灵感”的过程中,系统通过价值函数来模拟人类的数学审美。借助强化学习技术,系统内置的“价值模型”能实时预判每一条推理路径的潜力——不仅判断结论是否成立,更在乎推导过程是否简洁。

“当AI发现一个命题的证明难度显著高于其构建复杂度时,它便捕捉到了那一抹‘直觉性的灵感’。”论文第一作者、北京通用人工智能研究院研究员张驰说,这种“价值引导”能让模型从浩如烟海的空间组合中,精准捕捉到那些具备人类数学家审美标准的高质量题目,“实现了从‘模仿解题’到‘自主创造’的范式转变,这在国际上尚属首次。”

图为团队成员正在讨论算法设计的几何问题。新华社发

张驰介绍,通矩模型仅需单张消费级显卡即可在最多38分钟内解决2000年以来所有国际数学奥林匹克竞赛的几何难题。实验表明,其推理效率和准确率均达国际先进水平。

论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示,通矩模型的意义不仅在于解题速度的提升,更在于其通过模拟人类数学家的直觉和审美,实现了“小数据、大任务”的范式转化。

“这种不依赖海量标注数据、通过内部逻辑自我演化的路径,正是通用人工智能发展的关键。我们的系统不仅能与国际最先进的AI系统对标,更在理解逻辑底层美学和自主发现科学规律方面走在了前列。”他说。

据悉,目前,通矩模型自主生成的3道原创的几何新题,已入选2024年全国中学生数学联赛(北京赛区)。

张驰表示,这一成果为未来自动化数学证明、个性化智能教育及科学大模型的开发提供了技术支撑,有助于为更多感兴趣的青少年提供优质题目和讲解服务。未来,团队将继续深耕通用智能模型,推动中国人工智能技术在更多复杂逻辑与科学发现领域实现领跑。

相关内容

热门资讯

原创 猎... 大家好,我是正在汇总信息的何二维一。 今天游戏也是于先遣服正式更新了1.5版本,虽然内容量和咱们之前...
《生化危机:安魂曲》导演称新作... IT之家 1 月 26 日消息,《生化危机:安魂曲》导演中西晃史今天接受游戏媒体 EuroGamer...
华为多款手机通过星闪认证,测试... IT之家 1 月 26 日消息,国际星闪联盟官网显示,华为多款手机新通过了星闪认证,主要覆盖车钥匙协...
苹果新一代Siri下月登场!i... 快科技1月26日消息,本月早些时候,苹果与谷歌正式宣布达成合作,为今年晚些时候推出的产品功能(如Si...
“写实动漫风”的终末地,靠什么... 最近几天,就算你没玩过《明日方舟:终末地》(以下简称《终末地》),大概率也从各个渠道知道了这款游戏公...
1月27日精选热点:马斯克星舰... 1、算力租赁:腾讯春节分10亿现金,百度文心助手5亿跟进春节AI大战 据报道,腾讯发布《关于春节分1...
史上最优秀移动处理器!酷睿Ul... 一、前言:能与Zen 5不相上下的E-Core 如果一个月前有人告诉你1款拥有16个大核的高性能笔记...
四川省地质灾害风险预警系统通过... 为进一步优化提升地质灾害防治业务系统功能,响应新形势下精细化、智能化防灾减灾需求,自然资源厅抓住增发...
科研单位ALD设备配套VMB阀... 引言:科研用VMB阀门的特殊需求 在原子层沉积(ALD)等高端科研设备中,阀门分配箱(Valve M...
欧盟对马斯克旗下X平台展开调查... 来源:市场资讯 (来源:财联社) 财联社1月26日讯(编辑 夏军雄)当地时间周一(1月26日),欧盟...
可“解难题”也可“出好题”!中... 新华社北京1月26日电(记者魏梦佳)中国科研团队近日自主研发出的一款“通矩模型”,该成果26日晚在线...
北京航空航天大学讣告:沉痛悼念... 1月26日,北京航空航天大学发布讣告,沉痛悼念李未同志—— 在北航从事计算机科研与教育工作的李未...
哪款游戏手机性价比最高?202... 在2026年的游戏手机市场中,性价比已成为玩家最关注的选购指标。一台合格的游戏旗舰不仅要性能炸裂,更...
跨越千年的“对话”:前沿科技如... 东方网记者王佳妮1月26日报道:当千年文物遇见现代大科学装置,会碰撞出怎样的火花?由上海科技馆与故宫...
72%ChatGPT订阅者设其... 如果这一数据属实,那谷歌在搜索引擎领域的长期霸主地位将受到重大打击。过去几十年里,从来没有一款搜索引...
采用创新架构 新型“智能”芯片... 来源:科技日报 据最新《自然·电子学》杂志,包括意大利米兰理工大学在内的联合研究团队开发出一种新型“...
投影仪销量暴跌:电视降价、短剧... 两三年前,几乎每个人都曾考虑或购买过智能投影仪。在当时,投影仪被视为大屏娱乐的一种折中方案,它不像电...
2026年科学探索营本周开营:... 1月30日,由中国科学院系统的云南天文台、昆明动物博物馆和昆明植物园三方联合举办、针对12岁以上青少...
京东物流:38亿不买股权,买走... 文|三车财观 2026年初,中国物流业迎来了一个改写版图的里程碑交易。京东物流正式对外宣布,将以3...
杭州“模”力,又高又新 对发展方位的精确标注,体现了一座城市的战略远见与治理智慧。 加快构建城市多元智算供给服务体系,拥有6...