昂贵的GPT-4.5落寞,OpenAI的闭源豪赌还能走多远?
创始人
2025-03-02 00:01:33
0

21世纪经济报道记者白杨 北京报道

当地时间2月27日,OpenAI正式发布了其最后一个非思维链模型——GPT-4.5。

OpenAI表示,GPT-4.5是其迄今为止最大、最好的聊天模型,用户与它的交互感觉会更自然。

据21世纪经济报道记者了解,GPT-4.5目前可以访问最新的信息,支持搜索、文件和图像上传,并能通过画布进行写作和代码编辑,但不支持ChatGPT中的语音模式、视频和屏幕共享等多模态功能。

整个发布活动十分简短,仅持续了约13分钟,并且OpenAI CEO山姆·奥特曼(Sam Altman)未参加。

对于GPT-4.5,奥特曼评价称,这是第一个让他感觉“像是在和一个有思想的人交谈”的模型。他同时还揭露GPT-4.5面临的一项严峻挑战——“GPU短缺”。

“这是一个庞大且昂贵的模型”。奥特曼直言,OpenAI目前的GPU储备已经告急。为此,新发布的GPT-4.5只能先推送给每个月付费200美元的ChatGPT Pro用户。

“这不是我们想要的操作方式,下周我们将添加数万个GPU,然后将GPT-4.5推广到ChatGPT Plus用户”。奥特曼说。

情商更高、幻觉更低

据OpenAI介绍,GPT-4.5是以GPT-4o为基础进一步扩展了预训练,其在设计上要比推理模型更通用。

训练过程中,OpenAI主要通过扩展无监督学习和思维链推理两种范式来提升GPT-4.5的能力。

其中,扩展思维链推理教会模型在响应之前进行思考,使它能够解决复杂的科学、技术、工程和数学(STEM)或逻辑问题。而扩展无监督学习可以提高模型的准确性,降低幻觉率,并改善联想思维。

在SimpleQA基准测试中,GPT-4.5的准确率为62.5%,幻觉率为7.1%,这一成绩要远优于GPT-4o、OpenAI o1和o3-mini等模型。

此外,为了让模型更好地理解人类的意图,OpenAI还开发了新的可扩展技术,这些技术能够利用较小模型的数据来训练更大、更强大的模型,这进一步提高了GPT-4.5的可操控性、对细微差别的理解以及自然对话的能力。

在人类偏好衡量测试中,GPT-4.5在创意智力、专业查询和日常查询方面的表现均要高于GPT-4o。

基于这些优化,OpenAI在早期测试中发现,GPT-4.5的知识库更广泛,理解用户意图的能力更强,而且“情商”更高,这让它在写作、编程和解决实际问题等任务上表现出色。

值得一提的是,在科学、数学等基准测试中,虽然GPT-4.5的评估分数要明显高于GPT-4o,但也低于OpenAI o3‑mini。

对此,OpenAI表示,GPT-4.5在响应之前不会进行思考,这使得它的优势与OpenAI o1等推理模型截然不同。与OpenAI o1和OpenAI o3-mini相比,GPT-4.5是一种更通用、天生更智能的模型。

谈及未来模型的发展方向,OpenAI提出,“我们相信推理将成为未来模型的核心能力,而预训练和推理这两种扩展方法将相互补充。随着像GPT-4.5这样的模型通过预训练变得更智能、知识更丰富,它们将成为推理和工具使用智能体的更强大基础。”

“天价”的闭源模型

对于新发布的GPT-4.5,一位大模型行业人士向21世纪经济报道记者表示,两年前OpenAI发布GPT-4时曾惊艳世界,并引领了整个大模型行业的发展。但这次发布的GPT-4.5似乎没有太大升级,这让他有些失望。

实际上,OpenAI在发布GPT-4.5的同时一直强调,该模型并非前沿架构版本,因此在部分场景下的表现可能不及o1或o3-mini等尖端模型。

奥特曼也表示,“GPT-4.5不是一个推理模型,因此不会超越基准。但它是一种不同类型的智能,有一种我从未感受过的魔力。真的很期待人们尝试它!”

可十分尴尬的是,目前想要尝试GPT-4.5的成本非常高。

据记者了解,如果现在想要在ChatGPT中体验GPT-4.5,必须花费200美元成为Pro用户;如果是通过API接入,那每百万tokens输入75美元/输出150美元的价格,也堪称天价。

与GPT-4o相比,GPT-4.5的输入价格是其30倍,输出价格是其15倍。若与DeepSeek V3相比,GPT-4.5的输入价格更是高达280倍,输出价格高达150倍。

高昂的价格,让GPT-4.5变得毫无性价比。OpenAI也指出,GPT-4.5是一个非常庞大且计算密集型的模型,比GPT-4o更昂贵。因此,OpenAI也在评估是否继续长期提供GPT-4.5的API服务。

由此可见,GPT-4.5更像是一个过渡版本的模型,与之相比,外界或许更期待GPT-5的发布。

奥特曼在2月中旬已经明确表示,将在未来几个月内推出GPT-5,并且该模型将整合OpenAI的大量技术,包括o3,并应用于聊天机器人ChatGPT以及API平台。因此,OpenAI不再计划将o3作为独立模型发布。

奥特曼称,在GPT-4.5发布之后,OpenAI的首要目标是通过创建能够使用所有工具的系统来统一公司旗下的AI模型,让它能自主判断何时需要深度思考,何时无需多想,并且能够广泛适用于各种任务。

这也是OpenAI对其产品路线的一次重要调整。目前,ChatGPT付费用户可以选择使用GPT-4o、OpenAI o1、OpenAI o3-mini等多种不同模型产品。奥特曼表示,“我们已经意识到当前的模型和产品变得多么复杂。我和大家一样厌倦了ChatGPT里的模型选择界面,因此希望回归那种神奇的统一智能体验。”

他还宣布,GPT-5发布后,ChatGPT用户将在标准智能设置下免费无限制使用,而Plus和Pro用户可以体验更高的智能水平。

将最新的模型免费提供给用户,这也被外界认为是OpenAI向市场作出的妥协。360集团创始人周鸿祎近日向21世纪经济报道记者表示,经过两年的发展,大模型行业的格局发生了较大的变化,尤其是OpenAI构建的闭源壁垒,正在被开源浪潮瓦解。

周鸿祎举例称,“假如OpenAI现在推出GPT-5,能力比DeepSeek强,大家也不一定会去使用,因为DeepSeek免费,而且开源是更可信任的。”

他进一步表示,“当一个开源模型在性能上可以比肩闭源模型时,会形成强大的虹吸效应,并催生出一个繁荣的生态。在这里,许多基于开源模型的成果会加速涌现,同时这些成果也会回馈开源生态。因此,未来开源一定会战胜闭源。”

当下,OpenAI正面临前所未有的挑战。据市场消息,OpenAI正在寻求新一轮融资,并且这轮融资可能会使其估值翻倍,达到惊人的3400亿美元。

但公司高管接连出走、Scaling law放缓等变化,都让OpenAI的投入产出变得更加不确定。尤其是DeepSeek R1等开源模型的崛起,让整个行业的风向发生了改变,外界十分好奇,OpenAI接下来能否借助酝酿已久的GPT-5来捍卫自己的市场地位。

相关内容

热门资讯

超3亿美元!具身智能企业亿元融... 来源:中国证券报-中证网 12月19日,银河通用机器人(简称“银河通用”)宣布已于近期完成一轮超3亿...
谁在像送鲜奶一样送奶粉? 深夜,河北保定的李女士点开手机里的监控软件——又到了孩子吃夜奶的时间。屏幕里,老人正为孙子冲泡奶粉,...
3.9万亿元!精细化工行业如何... 来源:市场资讯 (来源:中国化工信息周刊) 关键词 | 精细化工现状及展望共 3285 字 | 建议...
解码AI新生态 “AI未来会像... 深圳商报·读创客户端记者 刘娥/文图 12月18日,由农业银行深圳罗湖支行、深圳广电集团财经频道、深...
简智机器人完成第三轮融资,加速... 来源:滚动播报 (来源:财闻) 本轮融资将用于核心产品迭代、数据产线规模化部署及全球市场拓展,巩固其...
阿维塔赴港IPO:一场针对“依... 文|不慌财说 在漫长的新能源公路赛中,孤勇者的故事不在少数,凭一己信念开疆拓土,却常在资金、技术与...
港股掀起18C章递表热潮,硬科... 今年以来,港交所的18C章特专科技上市通道突然“排起了长队”。 据证券时报记者统计,在2025年之前...
“活不过十天”的服务器,网易竟... 《逆水寒》这次玩大了,这是要关服跑路的节奏吗? 12月19日,网易旗下“会呼吸的江湖”《逆水寒》官...
钱多事少好金主?拉瑞安感谢腾讯 如果要让姬友们评选年度优秀甲方,姬友们会选择什么样的甲方作为梦中情甲呢?别的不说,钱多事少肯定是最优...
京东重磅新品!飞利浦 S610... 近期飞利浦 S6105 在京东自营平台重磅首发!飞利浦 S6105 智能手机携全能配置 + 内置 A...
眸深智能完成数千万元天使轮融资... 投资界12月19日消息,国内首个生成式通用具身大脑公司 「上海眸深智能科技有限公司(眸深智能)」宣布...
近8%增长超预期:游戏已成为中... 2025年中国游戏产业发展很难用一句话总结。数字在增长,挑战也不少,技术逐渐成为新质驱动力,文化输出...
康斯特:半导体制造需检测仪表校... 证券之星消息,康斯特(300445)12月19日在投资者关系平台上答复投资者关心的问题。 投资者提问...
中国游戏产业年会:鸿蒙游戏生态... 2025年度中国游戏产业年会12月17日至19日在上海市西岸国际会展中心举办,华为终端云服务互动媒体...
年度最佳选手被截胡?LCK A... 2025年对于LCK赛区来说,又是硕果丰收的一年,HLE拿下了第一届先锋赛的冠军,GEN则是在MSI...
传OpenAI正在寻求1000... AIPress.com.cn报道 据《华尔街日报》12月19日援引知情人士消息,OpenAI正在筹划...
我国数字消费占居民消费支出总额... 党的二十届四中全会明确坚持扩大内需这个战略基点,强调要大力提振消费,要以新需求引领新供给,以新供给创...
推动具身智能“全自主、更好用”... 12月18日,北京人形机器人创新中心(以下简称“北京人形”)开源国内首个且唯一通过具身智能国标测试的...
信德新材:碳纤维制品已进入光纤... 有投资者在互动平台向信德新材提问:“请问公司碳碳材料在航空航天领域的应用,以及现阶段的市场开拓情况?...
1登顶4入围!“中国元素”霸榜... 今天,最新一期美国《科学》杂志公布了2025年度十大科学突破评选结果。 其中,中国引领全球可再生能源...