「欧洲版 DeepSeek」发布新模型,盯着中国 AI 打
创始人
2025-12-05 11:01:15
0

被称为「欧洲版 DeepSeek」的 Mistral AI 在被 OpenAI、Google 和中国开源模型 DeepSeek、Qwen 夹击大半年后,终于坐不住了,正式发布了新一代 Mistral 3 系列模型。

Mistral AI 是一家总部位于法国的大模型公司。据报道,今年 9 月,英伟达第三次出手投资这家初创企业。经此,Mistral 的估值达到约 135 亿美元,成为欧洲 AI 领域最受瞩目的独角兽之一。

这一次,Mistral 居然只盯着中国模型打

Mistral 3 这次带来了旗舰模型 Mistral Large 3,以及三款高性价比的小模型 Ministral (3B、8B、14B)。

其中 Mistral Large 3 是绝对的主角,总参数量为 675B,其中活跃参数为 41B,这是自 2023 年底至 2024 年初的 Mixtral 8x7B 和 8x22B 以来,Mistral 首个开放权重的混合专家模型。

但最让我感到「不对劲」的是官方的对比策略。

在官方的跑分图里,Mistral 竟然完全无视了 GPT-5.1 或 Gemini 3,而是直接把枪口对准了中国的 DeepSeek-V3.1 和 Kimi-K2。

Mistral 的逻辑很直接:我的参数量只有 Kimi 的一半左右,但我的性能跟你五五开,甚至更强。

官方晒出的成绩单如下:

  • 赢面: 在 MMMLU 和 AMC 上,Mistral Large 3 分别拿到了 85.5 和 52.0 的高分,略微领先 DeepSeek-V3.1。
  • 输面: 在程序员最关心的 LiveCodeBench 和 SimpleQA 上,Mistral Large 3 还是输给了 Kimi-K2。

比 DeepSeek 笨,还贵 3 倍?

虽然 Mistral 试图证明自己是「效率之王」,但在 X 上,科技博主直接泼了一盆冷水,甚至用了「Mistral 正在缓慢死亡 (slow death)」这样严重的词。

他的评价简单粗暴,列出了 Mistral 新模型的三大罪状:

1. 更笨: 脑子不如 DeepSeek 好使。

2. 更贵: 价格却是 DeepSeek 的 3 倍。

3. 更慢: 推理速度甚至比 GPT-5 还慢。

这确实戳到了痛点。在 Artificial Analysis 的最新综合 AI 指数榜单上,Mistral Large 3 的得分只有 38 分。

看看排在前面的谁?Gemini 3 Pro(73分)、Claude Opus 4.5(70分)、GPT-5.1(70分)。Mistral 距离第一梯队的差距,已经不是「追赶」,而是断层了。

在 LMArena 排行榜中,它在开源非推理模型中排第二,总榜第六。成绩尚可,但绝对称不上「屠榜」。

有测试者发现 Mistral Large 3 各个方面都表现不佳:

  • 该模型难以正确执行工具调用,常会输出格式错误或无效的工具调用指令。
  • 在基于图像的基准测试中表现平平。

真正值得冲的,其实是小模型

Ministral 3 是所有开源模型中性价比最高的产品。每种参数规模均提供基础版、指令版和推理版,且均具备图像理解能力,全部基于 Apache 2.0 许可证开源。

这意味着什么?你可以免费商用,随便魔改。

  • 全能: 所有尺寸都支持图像理解,不再是「瞎子」 。
  • 能打: 14B 的推理版在 AIME’25 测试中准确率达到了 85%。

Mistral 3 确实进步了,就像网友说的那样:欧洲仍有一家前沿模型制造商能基本跟上中国开源模型的步伐,尽管 Mistral 尚未推出推理器,其实际性能仍落后于时代。

但在 DeepSeek 把大模型价格打下来的今天,仅仅做到「性能不错」已经不够了。用户要的是极致的聪明,或者极致的便宜。

目前的 Mistral ,似乎卡在了一个尴尬的中间位置。能不能成为「欧洲之光」,可能真得看后续的迭代了。

相关内容

热门资讯

从产业园区到产业新城 来源:南昌日报 江西美晨通讯的数字化车间里,手机组装产线的实时数据在屏幕上跳动,产能较以往提升了30...
拉瑞安确认《神界》新作将使用A... 在公开《神界》新作之后,拉瑞安工作室曾经表示在游戏开发中使用了生成式AI,不过这些AI内容并不会在游...
产品化还是服务化?创业者如何在... 最危险的战略误判,莫过于让苹果去做私人定制,或让麦肯锡去卖标准软件包。产品型与服务型公司,从基因上就...
这些车企都要“复活”?可能没那... 2025年马上就要结束了,截至目前,新能源汽车的市场渗透率已经突破50%。在这个光鲜数据的背后,是一...
还剩8天!参与投票赢Switc... 【ZOL中关村在线原创新闻】圣诞节前夕,一场由三星存储与国内知名游戏社区Jump联合发起的【你的NS...
新门派炽霄!《剑侠世界3》“炽... 焰起九霄,燃势无双!《剑侠世界3》四周年资料片“炽霄问道”于今日盛大公测!第十九大门派「炽霄」执法器...
微芯新域:新药还在研发,企业为... 来源:川观新闻 川观新闻记者 陈昊 川观新闻成都观察 杨柳 文/图 选手故事 12月16日,成都微芯...
原创 海... 70美元,或者说495元能买到什么? 在2025年的游戏市场,这个问题在近期发售的《使命召唤:黑色行...
开战!移动率先打出6G“双王炸... 刚结束的2025年中国信息通信大会上,中国移动一口气带来了两项重磅成果:《中国移动6G传输技术白皮书...
哈迪斯+暗黑刷宝!吸血鬼割草爽... 《黑夜刀锋:幸存者》是一款吸血鬼暗黑哥特风幸存者游戏,玩家需反复闯入暗影笼罩的黑暗世界,直面潮水般的...
深入十大产业现场 360集团交... 来源:滚动播报 (来源:经济参考报) 从澜沧江畔的水电站到东吴证券的安全集中运营中心,再到重庆轨道交...
吊胃口!罗永浩公布华杉录音文件... 12月16日消息,日前有网友问罗永浩「录音的事过去了吗?」,罗永浩直接回了句「怎么可能」,还甩出个录...
机构:三方面聚焦6G投资价值 近日,在2025年中国信息通信大会暨中国通信学会学术年会“算网筑基,万智互联——面向6G的算力网络创...
解码海马区“高清地图” 浙江科学家发布的全球首张“正常人及阿尔茨海默病患者的海马单细胞分辨率空间转录图谱”,标志着在病理诊疗...
2025国际黑牛肝菌技术创新大... 12月16日,以“破局而立 向新而行”为主题的新时代・新未来—— 2025国际黑牛肝菌技术创新大会在...
邮储银行湖南省分行:金融活水滴... 衡山高新区恒岳重钢生产车间正在作业。人民网记者 刘汕摄 人民网衡阳12月16日电 衡山高新区恒岳重钢...
事关你的旧手机,2027年起强... 近年来,手机、电脑等电子产品更新换代频率加快,大量旧手机、旧电脑进入回收渠道,但是这些电子产品中存储...
苏奥传感:MEMS压力传感器已... 证券之星消息,苏奥传感(300507)12月15日在投资者关系平台上答复投资者关心的问题。 投资者提...
全球首个!“成都高新造”情感交... 红星新闻记者从成都高新区获悉,12月16日,由天府绛溪实验室培育的四川具身人形机器人科技有限公司(E...
职普融通、产教融合,济南职教“... “前方到站王府庄站……”在济南工程职业技术学院的智慧城轨实训中心,大二学生徐琮源正熟练地操作着模拟驾...