又一国产大模型刚刚开源!能使唤机器狗拿水
创始人
2025-12-26 21:22:09
0

智东西

作者 | 陈骏达

编辑 | 心缘

MiniMax最强编程模型开源了!

智东西12月26日报道,今天下午,MiniMax开源了其本周二发布的MiniMax M2.1模型,该模型主打编程能力和办公场景的可用性,在多语言编程、Agent、复杂指令方面都有明显提升。

MiniMax M2.1采用MoE(混合专家)架构,参数量为229B,激活参数量为10B,与此前开源的MiniMax M2一致。

在编程相关场景的核心榜单上,MiniMax M2.1相比于前代模型MiniMax M2的得分最高提升了60%(Terminal-bench 2.0)。尤其是在多语言场景上,MiniMax M2.1的表现甚至超过了Claude Sonnet 4.5和Gemini 3 Pro,并接近Claude Opus 4.5。

此外,为了考察模型“从零到一”构建完整、可运行应用程序的全栈能力,MiniMax构建并开源了全新基准测试VIBE。MiniMax-M2.1在VIBE综合榜单中拿到88.6的平均分,得分接近Claude Opus 4.5,并在几乎所有子集上都显著优于Claude Sonnet 4.5。

在办公场景、长程工具调用和综合智能指数上,MiniMax M2.1 相比M2也表现出稳步提升,多项得分打平或超过Claude Sonnet 4.5和Gemini 3 Pro。

其实,发布之初,MiniMax就宣布MiniMax M2.1模型将会开源,过去几天,MiniMax在与多个部署平台对齐测试,并于今天全面开源权重。

用户还可以在MiniMax开放平台和MiniMax Agent上使用这一模型。MiniMax提供了M2.1和M2.1-lightning两个版本的API,这两个API结果完全一样,但是后者速度更快,价格翻倍。

开源地址:

https://huggingface.co/MiniMaxAI/MiniMax-M2.1

https://github.com/MiniMax-AI/MiniMax-M2.1

MiniMax Agent:

https://agent.minimaxi.com/

一、多语言和App开发成重点,打造3D手势交互动画效果惊艳

在编程场景,MiniMax M2.1把多语言和App开发作为重点。

在M2.1中,MiniMax系统性提升了模型在Rust、Java、Golang、C++、Kotlin、Objective-C、Type、Java等编程语言上的能力。这些语言覆盖从底层系统到应用层开发的完整链路。

官方案例中,MiniMax M2.1基于React Three Fiber与InstancedMesh构建了一颗“3D梦幻圣诞树”,成功渲染7000+实例,支持手势交互与复杂粒子动画。可以看到,这颗“圣诞树”能根据用户的手势散开或者聚拢,页面效果流畅。

模型的多语言能力,扩展了模型在更复杂场景的应用。此前,主流模型在编程领域都存在偏科的现象,大部分模型更擅长Web端应用和网页前端的开发,而MiniMax加强了M2.1的Android与iOS开发能力、设计理解与美学表达能力。

下方案例中,M2.1使用Kotlin语言开发了一款安卓原生重力感应模拟器,利用陀螺仪传感器实现重力操控体验,并设计了视觉彩蛋,通过自然的UI过渡与碰撞特效,呈现“MERRY XMAS MiniMax M2.1”信息。

iOS开发中,M2.1打造了一个桌面交互小组件,设计了“沉睡圣诞老人”点击唤醒机制,逻辑完整且具备交互动画效果。

为了理解办公场景的复合指令约束,MiniMax此前已经为其模型引入了交叉思考(Interleaved Thinking)的能力。此次开源的M2.1在系统化问题解决方面的能力再次升级,执行任务时,模型不仅关注代码执行是否正确,同时关注对“复合指令约束”的整合执行能力。

二、模型驱动机器狗行动,还能充当数字员工

MiniMax M2.1还具备较强的Agent能力。MiniMax官方展示了多个案例。

比如,MiniMax M2.1可以直接用于驱动机器狗,理解用户“帮我去后面的吧台那瓶水来”的需求。模型能理解压力传感器变化意味着物品已经被放置,然后转身回去找用户。

Agent能力还体现在模型的工具调用能力上。下方案例中,MiniMax M2.1能自主调用Excel工具和雅虎财经,完成市场调研数据清洗、分析和图表生成任务。

MiniMax M2.1可以用于驱动数字员工。模型能够接受以文字形式展示的网页内容,并以文本形态的输入控制鼠标的点击行为和键盘输入,在日常办公场景下,完成行政、数据科学、财务、人力资源、软件开发类的端到端任务。

比如,模型可以在通讯软件上主动收集员工的设备请求,然后前往企业内部服务器上搜索相关文档获取设备价格,计算总成本并判断部门预算是否充足,然后记录设备变更。

或是在项目管理软件上查找被阻塞或积压的问题,然后在通讯软件上查找相关员工并咨询解决方案,根据员工反馈更新问题的状态。

模型也可以在代码库中查找答案。例如,某同事希望知道改动了某个文件的最近的合并请求是哪一个,检索相关的合并请求,找到编号并告知该同事。

结语:AI编程模型,持续深入生产级场景

随着AI编程的不断渗透,开发者和企业已经不再仅仅满足将编程模型用于简单的代码补全或片段生成。

本周,MiniMax与智谱都发布了主打编程能力的新模型,并强调模型在生产级环境的可用性与处理复杂、复合任务的能力。

未来,模型能否更深入地融入开发工作流、安全稳定地完成端到端任务,将成为影响其价值的重要因素。

相关内容

热门资讯

山东移动聊城分公司圆满完成德上... 鲁网12月26日讯近日,山东移动聊城分公司顺利完成德上高速临清连接线全线网络覆盖,实现路段4G、5G...
华为XMAGE影展上海开幕!M... 12月26日,华为影像XMAGE年度影像展·上海站在Fotografiska影像艺术中心正式开幕,这...
又一国产大模型刚刚开源!能使唤... 智东西 作者 | 陈骏达 编辑 | 心缘 MiniMax最强编程模型开源了! 智东西12月26日报道...
玉环大地铜业取得具备防护罩结构... 国家知识产权局信息显示,玉环大地铜业股份有限公司取得一项名为“一种具备防护罩结构的闸阀”的专利,授权...
发现新质生产力|青海以“绿”为... 塔拉滩光伏基地里,成群的牛羊在光伏板下吃草;中国电信(国家)数字青海绿色大数据中心,大屏上实时显示着...
讲述重庆的电影!斩获腾讯视频年... 近日, 腾讯视频“金鹅荣誉”及 “星光大赏”在海口举行, 活动颁发了70项行业荣誉。 来自重庆两江新...
2025年江西省省级工业互联网... 按照《江西省工业和信息化厅关于组织开展2025年工业互联网平台申报和动态评价工作的通知》(赣工信信推...
“合肥造”智能农机“出海记” 12月23日,合肥佳富特机器人科技有限责任公司(以下简称“佳富特公司”)园区内,两辆装载“JFT-A...
2025年副业赚钱攻略:实测6... 时间碎片化,收入多元化,这些靠谱平台帮你解锁“薪”技能。 随着生活成本的增加和互联网的普及,越来越多...
原创 成... 小米 17 Ultra 杀疯了!6999 元起步配 512GB,这波操作直接把高端手机市场的 “潜规...
2025年拍照最强手机推荐:影... 在手机影像技术飞速发展的2025年,消费者对拍照性能的追求已达到全新高度。本文将为您带来当前市场上拍...
荣耀WIN系列手机发布:内置2... 12月26日 荣耀今日召开新品发布会,正式推出了主打高性能与电竞体验的WIN系列手机,包含荣耀WIN...
我国大型人工硐室储气试验获重大... 12月25日,中国能建对外宣布,已在长沙完成大型人工硐室储气原位试验,创造了该领域运行时长与可靠性的...
全球首套超高温热泵储能技术发布 来源:中国能源网 作为能源转型的关键基石,长时储能在构建新型电力系统中发挥着重要作用。《中国能源报》...
2025年3款苹果语音转文字工... 先看价格。Transcribe按分钟收费,0.3元/分钟。录1小时会议,要18元。用得多就贵。Lec...
一文读懂什么是云POS系统|上... 导言:从“本地软件”到“云端服务”的时代跨越 当传统的本地POS还在为维护和升级烦恼时,一种更灵活...
推出App Store,宇树会... 来源:市场资讯 (来源:钛媒体APP) 临近年关,宇树科技的曝光又多了起来:先是月初传出了和竞争对手...
梦想与征程电脑版下载 梦想与征... 《梦想与征程》是一款精灵题材的竖版放置类游戏。匠心打造豪华战斗画质,在战斗中展示超华丽炫酷精灵必杀技...
国和兴科技取得电解水制氢储氢一... 国家知识产权局信息显示,北京国和兴科技有限公司取得一项名为“一种电解水制氢储氢一体化装置”的专利,授...
壹点企讯|华为官宣六大健康管理... 12月25日,第二届华为终端健康管理行业峰会在深圳召开。华为擎云发布了六大健康管理解决方案及全新商用...