全球开源大模型,前十五名全是中国的
创始人
2025-08-26 13:01:31
0

机器之心报道

机器之心编辑部

国产开源力量的集中爆发。

都在说国内大模型正在驰骋开源领域,具体的情况如何?

近日,随着新一代大语言模型(LLM)的一波更新,开源大模型再次成为了热门讨论话题。软件工程师、自媒体 Rohan Paul 发现了一个惊人的现象:Design Arena 排行榜上排名前十几位开源 AI 模型全部来自中国。

Design Arena 是目前全球最大规模的众包 AI 生成设计 Benchmark 平台,它的核心机制是让真实的人类用户进行评测,基于 Elo Rating(类似于国际象棋评分体系)等级分制度进行模型对战。

用户在平台上会被随机展示两段由不同模型生成的回答,然后进行投票选择「哪一个更好」。每一次投票都会影响对应模型的 Elo 分数,进而形成动态的排行榜。Elo 核心原理是,高分选手击败低分选手,得分会很少,而低分选手爆冷战胜高分选手时,得分会很多。因此用对弈的角度来看的话,这是一个相对公平、符合认知的评分系统。

因此,不同于 MMLU、SWE-Bench 这类客观指标,Design Arena 更贴近于「用户真实体验」。新模型一上线,就能迅速通过对战获得口碑分数。

在 Design Arena 上,如果把条件设定为「开源」,可见现在的前 15 名是清一色的国产开源大模型

排名第一的是 DeepSeek-R1-0528,智谱的 GLM-4.5 和阿里的 Qwen 3 Coder 480B 紧随其后。

再往下我们能看到 DeepSeek、Qwen、GLM 的各种型号,Kimi 在 7 月份开源的 K2 模型…… 一直到第 16 名才是 OpenAI 最近开源的 GPT OSS 120B。

在前 15 名中,各家大模型厂商上榜的模型数量依次如下:

  • 阿里:6 款
  • DeepSeek:5 款
  • 智谱:3 款
  • Kimi:1 款

最近一段时间,国内 AI 公司不断发布新一代开源大模型,正在开拓 AI 技术的前沿。甚至对于国内科技公司来说,开源已经成为了最近一两个月发布的主旋律。

在 Hugging Face 发布的中国 AI 社区 7 月开放成果中,包括阿里、智谱、昆仑万维、月之暗面、腾讯、阶跃星辰等在内的多家厂商先后开源了 33 款大模型

此前还有机构 Interconnects(深度聚焦前沿 AI 研究的高质量内容平台)汇总了国内顶尖的 19 家开源模型实验室,包括 DeepSeek 这样的顶级机构,以及一些通过技术报告和小众模型崭露头角的新兴学术实验室。

这 19 个开源玩家依次是:DeepSeek、Qwen、Moonshot AI (Kimi)、Zhipu / Z.AI、StepFun、Tencent (Hunyuan)、RedNote (Xiaohongshu)、MiniMax、OpenGVLab / InternLM、Skywork、ByteDance Seed、OpenBMB、Xiaomi (MiMo)、Baidu (ERNIE)、Multimodal Art Projection、Alibaba International Digital Commerce Group、BAAI 以及 inclusionAI、Pangu (Huawei)。

在大模型领域里,技术和性能领先的一直是以 GPT 系列为代表的闭源大模型。但随着 Llama 系列兴起,越来越多的开源模型逐渐成为了推动技术向前进步的重要动力。近一年多时间里,国产大模型集群式的崛起,则重塑了全球 AI 版图。

现在说起开源的大模型,大多数人的第一反应早已不是 Llama,而是 Qwen 和 DeepSeek。有人认为,正是 DeepSeek 等开源大模型能够与闭源顶尖模型分庭抗礼,才让众多应用端公司得以转变工作重点,把精力放在模型调优和应用优化的工作上来,进而加速了 AI 技术的落地。

或许这样的趋势也会扭转 AI 研究社区的趋势,让未来最先进模型的开源成为必选项。

最后,在外网也有人在为中国的 AI 模型崛起寻找深层原因。这位 Illya Gerasymchuk 是数学专业的硕士,他认为原因在于数学基础 —— 目前东亚人在数学领域上已经占据了主导地位。

这是否和我们一直以来的印象已经有些不一样了?

参考链接:

https://www.designarena.ai/

https://x.com/rohanpaul_ai/status/1959710355208499692

https://x.com/interconnectsai/status/1957105950201950715

相关内容

热门资讯

天一爱拓取得称重混料装置专利,... 国家知识产权局信息显示,江西天一爱拓膜科技有限公司、江西爱科道环境科技发展有限公司取得一项名为“一种...
流量卡和随身wifi,你会选谁... 办卡关注 微 信 公 众 号 :一卡空间 这里是专为你打造的流量卡服务站,既能帮你揭开流量卡市场的各...
《云南省全面实施“人工智能+”... 云南省人民政府办公厅日前印发《云南省全面实施“人工智能+”行动计划》。其中提出,以科技、产业、消费、...
羽玺新材取得薄膜拉伸试验装置专... 国家知识产权局信息显示,四川羽玺新材料股份有限公司取得一项名为“一种薄膜拉伸试验装置”的专利,授权公...
县市区动态 |诸城市科技局:校... 今年以来,诸城市科技局通过系统布局,打好校地协同发展的“组合拳”,着力打造集技术攻关、成果转化、产业...
中泰新能源取得太阳能电池板固定... 国家知识产权局信息显示,保定中泰新能源科技有限公司取得一项名为“一种太阳能电池板固定装置”的专利,授...
格力博:与智元机器人合作正稳步... 证券之星消息,格力博(301260)12月24日在投资者关系平台上答复投资者关心的问题。 投资者提问...
晶致创享取得一种会议平板专利,... 国家知识产权局信息显示,宁波晶致创享科技有限公司取得一项名为“一种会议平板”的专利,授权公告号CN2...
万孚生物:获医疗器械注册证 进... 中证报中证网讯(王珞)12月25日晚间,万孚生物发布公告称,公司近日收到国家药品监督管理局颁发的医疗...
咸安(武汉)离岸科创中心:全年... 中新网湖北新闻12月25日电 (洪瑞 王敏)今年以来,咸安(武汉)离岸科创中心深度践行“研发在武汉、...
超声电子:截至2025年6月底... 证券日报网讯 12月25日,超声电子在互动平台回答投资者提问时表示,公司始终坚持以科技创新为发展驱动...
我国突破5G工业终端计量测评关... 24日,从市场监管总局获悉,我国已成功攻克5G通信工业终端计量与测评关键技术,构建起完整自主的5G工...
钉钉CTO朱鸿:不进生产环节的... 12月23日下午,由钉钉主办的2025钉峰会·泛制造业专场顺利举办。本次活动聚焦制造业在AI时代的范...
WB4-3青训破军,司空震托梦... WB和青训破军打到巅峰对决,4-3艰难获胜,看来是错怪KSG了,破军是真的很强,一度用手法把WB打蒙...
南京长友取得顶部可收缩集装箱专... 国家知识产权局信息显示,南京长友彩钢钢结构有限公司取得一项名为“一种顶部可收缩的集装箱”的专利,授权...
迈向通用人工智能路上,如何让大... 最近,国家网信办发布了一项关于生成式人工智能的数据——截至2025年11月1日,累计有611款生成式...
大厂抢AI人才,投资人蹲守大厂... 作者丨Lucas 编辑丨刘恒涛 图源丨Midjourney “你很难想象,大厂对AI人才有多渴望。”...
一家专注全球游戏支付与变现发行... 今年,对于中国游戏出海来说,依然是特殊的一年。 12月19日,2025中国游戏产业年会在上海徐汇举行...
原创 开... 《崩坏:星穹铁道》3.8版本填上了2.0-2.3时期的坑,堪称匹诺康尼最强完结章,不过在填坑的同时,...
南沙跃升:金融与科创双轮驱动下... 来源:21世纪经济报道 深海智人企业,来源:南沙区宣 南方财经记者陈梦璇 南沙报道 深海1500米...