OpenAI发布GPT-5.2 错误减少30% 表现超越专业人士
创始人
2025-12-12 17:41:57
0

【CNMO科技消息】12月12日,据外媒报道,在推出GPT-5.1仅一个月后,OpenAI今日正式发布了下一代模型系列GPT-5.2,该系列将为其广受欢迎的聊天机器人提供动力。官方称,GPT-5.2是迄今为止“面向专业知识工作最强大的模型系列”。

GPT-5.2旨在帮助人们更快地完成更多工作。它在创建电子表格、制作演示文稿、编写代码、图像感知、理解长上下文、使用工具以及完成多步骤项目方面表现更佳。新模型在通用智能、长上下文理解、智能体工具调用和视觉能力上均有改进,非常适合现实世界的专业应用。

具体而言,GPT-5.2的“思考”版本比GPT-5.1的“思考”版本产生幻觉更少,包含错误的回复减少了30%。其长上下文处理能力显著提升,能够驾驭报告、合同、论文及多文件项目,在数十万tokens的范围内保持准确性。同时,它在解读截图、技术图表和可视化报告方面也更为出色。

OpenAI表示,在涵盖44种职业的知识工作任务测试中,GPT-5.2的表现超越了行业专业人士,在GDPval测试中获得了70.9%的分数。相比之下,GPT-5.1在该基准测试中的得分为38.8%。这使得GPT-5.2成为OpenAI首个达到或超越人类专家水平的模型。

对于ChatGPT用户而言,GPT-5.2将显得更有条理、更可靠,并具有更温暖、更对话式的语调。OpenAI介绍,GPT-5.2 Instant是日常工作的得力助手,在信息搜索、步骤指南、技术写作和翻译方面有改进;GPT-5.2 Thinking适用于更复杂的任务,如总结长文档、编程、回答关于上传文件的问题以及规划决策;而GPT-5.2 Pro则专为那些值得等待更高质量答案的难题设计。

GPT-5.2 Instant、Thinking和Pro版本即日起向付费ChatGPT用户推出,其API也将面向所有开发者开放。

此次新一代模型的发布,距离OpenAI首席执行官山姆·奥特曼宣布“代码红色”状态仅过去一周。他当时要求员工专注于改进ChatGPT,以确保其不会落后于谷歌的Gemini和Anthropic的Claude等竞争对手。GPT-5.2的迅速面世,无疑表明了OpenAI在激烈AI竞赛中保持领先地位的决心。

相关内容

热门资讯

内网培训系统是什么?网络培训平... 内网培训系统与网络培训平台各具优势,为企业学习提供了强有力的解决方案。内网培训系统专注于企业内部,通...
亚历山大・王牵头,消息称Met... IT之家 12 月 21 日消息,据《华尔街日报》报道,Meta 公司正全员动员,在由 Scale ...
阐释独特生产模式 新广益设备改... 12月19日下午,苏州市新广益电子股份有限公司(以下简称“新广益”)首次公开发行股票并在创业板上市的...
独家|阿里钉钉启动“D计划”项... 转自:财联社 【独家|阿里钉钉启动“D计划”项目 或剑指AI硬件新形态】《科创板日报》19日讯,《科...
海南封关外籍主播涌入澄迈直播基... 来源:新鲜速递 嗯,用户搜索了"海南封关 这群外籍主播为何扎堆涌入",我需要从搜索结果中找出原因。先...
中国大模型产业从狂热投入迈入可... 来源:滚动播报 (来源:千龙网) 中国最大的独立大模型厂商,北京智谱华章科技股份有限公司,已率先通过...
爱朋医疗:公司布局了多模态AD... 证券日报网讯 12月19日,爱朋医疗在互动平台回答投资者提问时表示,公司布局了多模态ADHD行为训练...
原创 普... 以前总觉得“神魔大战”是传说,直到《新倩女幽魂》新版本“一念神魔”上线,我才知道原来“成神”和“堕魔...
谷歌SEO高质量外链获取攻略与... 想为你的网站找到高质量且有效的外链资源,但面对浩如烟海的互联网,你是否感到无从下手,担心投入大量时间...
华为云零售峰会2025:Dat... 12月18日-12月19日,“共筑智能时代伟大品牌——华为云零售峰会2025”在成都举办。会上,泸州...
AI人才争夺战白热化,谷歌另辟... IT之家 12 月 20 日消息,在 OpenAI、Meta 和 Anthropic 之间的人才竞争...
SpaceX罕见披露卫星失联事... 据媒体19日报道,数小时前,近期备受资本市场关注的SpaceX罕见披露了一起在轨卫星事故。 据“星链...
【年度AI观察】2025,人形... 文 | 智能相对论 作者 | 许成行 2025年,人形机器人产业在争议中迎来发展深水区。 一边是20...
爆屏修复机构排名揭秘:靠谱好用... 在当今数字化时代,手机已经成为人们生活中不可或缺的工具。然而,手机屏幕不慎摔碎、出现裂痕等爆屏情况时...
“风清”“风雷”“风顺”气象人... (来源:经济日报) 转自:经济日报 12月19日,中国气象局发布“风清”“风雷”“风顺”三个气象人...
“固态电池”上市容易,上车可就... 作者|Hayward 原创首发|蓝字计划 在“国产 GPU 第一股”“国产GPU 第二股”点燃投资市...
“千兆上网”仍卡顿,运营商回应... “光纤到户,千兆上网”近年在大城市逐渐普及,然而很多用户在打游戏或者视频直播时依然会遇到卡顿问题,这...
元戎启行获产业巨头追捧,剑指2... 来源:华旋评测 据媒体报道,元戎启行获得国内头部Tier 1和海外豪华车企的青睐,可能获得战略投资。...
ChatGPT新增暖心程度调节... IT之家 12 月 20 日消息,据科技媒体 The Verge 今天报道,OpenAI 昨天在 C...
广告电商MCN协同发展,哪家母... 概述 在母婴垂直领域,多个平台基于用户规模、服务范围与专业度等维度呈现不同特点。以下内容基于公开信息...