从“百模大战”到“十个手指头能数过来”,我们为什么还要“死磕”基础大模型
创始人
2026-01-18 20:21:44
0

来源:滚动播报

(来源:上观新闻)

2023年,中国人工智能(AI)行业上演了一场“百模大战”,截至当年年底,全国拥有10亿参数以上的大模型有近80个、100亿参数级的大模型逾10个,场面一度繁荣至极。两年多过去,当初的喧嚣已逐渐平息。据业内人士透露,还在持续研究基础大模型的企业已不足10家,其中包括商汤科技、稀宇科技、阶跃星辰等几家上海企业。

2025年,各种AI应用层出不穷,写文案、情感陪伴、重塑供应链……当甜美的果实已唾手可得,为什么上海AI企业还在“死磕”基础大模型?

Gemini 3成为爆款源于一次逆风坚守

2025年,AI领域的高潮一波接一波。11月,谷歌发布新一代人工智能模型Gemini 3,在最能体现大模型整体实力的LMArena排行榜上,它以1501分稳居第一;在“地狱难度”的数学能力测试中,它以23.4%的得分率远超竞争对手,而OpenAI的GPT-5.1等模型得分率仅在1%左右。

这被视作谷歌在AI领域的一场“绝地反击”,也彻底扭转了其在大模型竞赛中落后的风评。在2022年底ChatGPT引爆生成式AI浪潮后,被业内公认为AI“优等生”的谷歌一度陷入被动,产品迭代节奏滞后、市场信心动摇,有人不客气地评价它“起了个大早,赶了个晚集”。

上海模速空间内AI应用层出不穷。受访者提供

逆风局中,谷歌没有跟风OpenAI的“模仿学习到强化学习”路线,而是继续坚持自己的“理解生成一体化”路线,这与谷歌将大模型定义为提升效率的超级工具,而非情感伴侣有关。在生成式AI的长跑中,谷歌试图以耐力超越对手。凭借着出色的理解和推理,Gemini 3在应用市场上表现强劲,截至去年11月,其全球月活跃用户同比增长170%。

坚持是大模型研究的“稀有品质”。国内“百模大战”期间,复旦大学计算机科学技术学院教授邱锡鹏就注意到大模型同质化问题严重。在他看来,这些大模型虽然名字、作用不同,但背后都是“一张脸”,更令他焦虑的是,该领域的基础研究却在萎缩。以自然语言处理为例,2015年前,这个领域有对话、问答、机器翻译等各种方向,那时的学者互相分享自己的研究,并从别人那里获得灵感,而当大家都涌向语言模型这条赛道时,更多的可能性被扼杀了。

基础大模型决定应用能力上限

“我们会一如既往坚持基础大模型研究。”阶跃星辰副总裁李璟说。这家成立不到3年的沪上AI企业已累计发布22款基座模型,其中包括拥有强大视觉感知和复杂推理能力的新一代基础大模型Step 3。

阶跃星辰选择“死磕”基础大模型的逻辑相当简单:基础大模型的能力决定了应用的上限,目前大模型技术尚未收敛,如果过早将资源押注应用开发,一旦底层技术发生根本性变革,之前的研发将很快被新技术所取代。

在成立第十个年头、生成式AI成为产业主线的背景下,商汤于2024年底启动业务与组织架构分拆,推出“1+X”战略:将偏向应用层的智能驾驶“绝影”、家庭机器人“元萝卜”、智慧医疗“善萃”、智慧零售“善惠”等业务整合为“X创新业务”,自身则进一步聚焦生成式AI与视觉AI双引擎这“1”核心。

商汤元萝卜下棋机器人。受访者提供

这一调整并非技术路线的试探,而是商汤在完成AI代际转换之后,对核心能力与资源配置的再聚焦。生成式AI对商汤而言,已不再只是技术层面的突破,而是成为驱动公司未来增长的核心业务。

2025年,AI世界热点转换,世界模型成为焦点。美国斯坦福大学教授李飞飞领导的World Labs(世界实验室)推出3D世界生成模型Marble,并直言AI的下一个10年属于空间智能。同年,商汤也推出“开悟”世界模型3.0,在业内人士看来,该模型在对真实世界的建模能力上表现出色,其生成的视频具备很强的时间与空间一致性,有能力与Marble展开直接竞争。更令人惊讶的是,商汤早在2024年就已推出这一模型。

“不同的声音”正在复苏

产品覆盖200多个国家和地区、个人用户超2亿、月活用户超2700万——在个人用户端风生水起的Minimax(稀宇科技)也没有放弃基础大模型的研发。

去年10月,稀宇科技掀起一场AI技术的“全家桶”发布,文本大模型M2、视频模型海螺2.3、语音模型Speech 2.6和音乐模型Music 2.0,标志着中国AI企业在全模态技术领域的全面突破。

Minimax在港交所上市。受访者提供

其中,仅有10B激活参数的M2大模型在全球权威测评榜单Artificial Analysis(AA)上取得历史性突破——总分冲入全球前五、开源第一,跻身全球文本模型第一梯队。更令人称奇的是,M2的综合成本只有名列全球大模型“S级”梯队中的Claude 4.5的8%,推理速度却是后者的近两倍。这种“高智能,更实惠”的理念正在从根本上改写AI领域的“算力游戏”规则。

有意思的是,AI赛道上“不同的声音”正在复苏。复旦大学计算与智能创新学院教授张军平就提醒,现在AI的研究路径可能走反了,人类智能的进化应先从“感知”开始,再发展“认知”,也有人仍坚信能从以IBM沃森机器人为代表的“AI符号主义”技术路线中寻得新突破。

创新成果越是唾手可得,爆款越有可能出自冷门,这正是颠覆式创新的神奇之处。历史经验告诉人们,需要有组织的科研去捕捉“异常”,甚至颠覆已有体系。所以,为什么上海AI企业仍要“死磕”大模型?因为技术尚未收敛,一切皆有可能。

原标题:《从“百模大战”到“十个手指头能数过来”,我们为什么还要“死磕”基础大模型》

栏目主编:戎兵

来源:作者:文汇报 沈湫莎

相关内容

热门资讯

CAAC无人机培训如何选择正规... CAAC无人机执照(全称:民用无人机驾驶员执照)是由中国民用航空局(CAAC)颁发的官方飞行资质,是...
辰舟电器取得扬程高的离心水泵专... 国家知识产权局信息显示,深圳市辰舟电器有限公司取得一项名为“一种扬程高的离心水泵”的专利,授权公告号...
向新赛道“变轨”,科技保险加速... 政策与产业双驱动之下,科技保险发展驶入“快车道”,加速向产业服务新赛道“变轨”。1月18日,北京商报...
高通GPU工程高级副总裁Eri... IT之家 1 月 17 日消息,高通 GPU 工程高级副总裁 Eric Demers 昨日表示,其即...
专家学者齐聚汕大医学院,共话A... 如何拥抱智能浪潮,培养兼具精湛医术、数字素养与人文关怀的“新医科”人才,已是当下医学教育领域的重要命...
合肥经开区新获评1家全球“供应... 2026年1月15日,世界经济论坛公布新一轮全球制造业“灯塔网络”名单,合肥经开区再传捷报——联合利...
美载人绕月飞行任务进入关键准备... 新华社洛杉矶1月17日电(记者谭晶晶)美国航天局17日将执行“阿耳忒弥斯2号”载人绕月飞行任务的火箭...
谷神星二号中型固体运载火箭首飞... 封面新闻记者 杨峰 据新华社消息,1月17日12时08分,谷神星二号民营商业运载火箭在酒泉卫星发射中...
从“百模大战”到“十个手指头能... 来源:滚动播报 (来源:上观新闻) 2023年,中国人工智能(AI)行业上演了一场“百模大战”,截...
【每周推荐】每周手机选购第32... 前言 这周和上周一样,主力依旧是湖南/四川/辽宁等地区的15%国补,如果有国补资格,那淘宝和拼多多都...
宇盛通取得数据线接头及数据线专... 国家知识产权局信息显示,东莞市宇盛通新材料电子科技有限公司取得一项名为“一种数据线接头及数据线”的专...
宁夏新化化工攻克香料合成关键技... 1月16日,记者从自治区工业和信息化厅获悉,宁夏新化化工有限公司立足宁东能源化工基地的原料与成本优势...
南天信息取得触控显示装置及电子... 国家知识产权局信息显示,云南南天电子信息产业股份有限公司取得一项名为“触控显示装置及电子设备”的专利...
海信视像灯塔工厂:解锁AI智造... 海信视像灯塔工厂:解锁AI智造新模样 以人工智能AI驱动“需求洞察—研发—生产—交付”全流程升级,彻...
AI视频这条超卷的赛道上又,有... “AI视频是一个非常卷的赛道,大家每三个月就要更新一次模型,每一个月就要上线一次新功能,甚至每一周都...
北京“远航天梦”航天科技体验中... 来源:市场资讯 (来源:环球网资讯) 来源:环球网 2026年 1月16日,“青少年航天筑梦科普行动...
原创 O... 大家好,我是乔叔,今天咱们说说最近闹得挺火的ChatGPT新出的翻译工具,看看它到底让没让老百姓省心...
好品山东·优特农品牵手阿里集团... 1月16日,“好品山东·优特农品走进阿里巴巴产销对接活动”在杭州市阿里巴巴数字生态创新园正式拉开帷幕...
中国航发“太行”系列燃气轮机创... 中新网北京1月18日电 (记者 孙自法)记者1月18日从中国航空发动机集团(中国航发)获悉,中国航发...
新规发布!13类食品在直播间里... 日前,记者从市场监管总局获悉,《直播电商经营者落实食品安全主体责任监督管理规定》正式发布,将在今年3...