DeepSeek之后首个!进击的MiniMax
创始人
2025-06-21 06:41:32
0

历经两年多的狂飙突进,国内大模型行业正在快速收拢。随着DeepSeek的横空出世,竞争格局也发生了改变,国产大模型六小虎中多家进行战略调整、放弃模型预训练,互联网大厂也在发挥资源优势进击、转向布局自己更擅长的领域。

在这个过程中,是否要拥抱DeepSeek来增强自己的基模实力,是横亘在所有模型厂商面前的一道选择题。6月17日起,大模型六小虎之一Minimax开启连续5天的新品发布,首日就推出了用不同于字节、DeepSeek的强化学习方法训练的全球首个开源混合架构推理模型MiniMax-M1。由此开始,Minimax也陆续交出了自己在DeepSeek大火这几个月来筹备的新品,包括能生成AI视频行业目前最高难度运动场景的新视频生成模型 Hailuo 02和MiniMax Agent、视频Agent等产品。

DeepSeek向前走了一步,但前面还有很多步,MiniMax正在做出尝试。

MiniMax开启5天上新周

其中,文本新模型MiniMax-M1是世界上首个开源的大规模混合架构的推理模型。MiniMax方面表示,M1在面向生产力的复杂场景中是全球开源模型中的最好一档,超过国内的闭源模型,接近海外的最领先模型的同时又有业内最高的性价比。目前,MiniMax以业内最低的价格在官网提供M1模型的API服务。

MiniMax在技术报告中提到,M1的一个显著优势是支持目前业内最高的“100万”上下文的输入,这个上下文输入量等同于闭源模型里Google Gemini 2.5 Pro的输入量,也是DeepSeek R1的8倍之多。在推理输出量上,M1目前也达到了业内最长的8万Token。

根据公开资料整理

据悉,输入长度的提升也主要得益于MiniMax独创的以闪电注意力机制为主的混合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。例如,在用8万Token深度推理的时候,只需要使用DeepSeek R1约30%的算力。这个特性使得在训练和推理的时候都有很大的算力效率优势。

MiniMax-M1发布后引起了开发者的广泛探讨。其中,著名AI博主MinChoi评论称,MiniMax-M1简直可以说集Manus 、Deep Research、计算机技能和可爱于一体,随即他还展出了自己用MiniMax-M1做的10个有趣案例。知名AI博主、佐治亚理工学院机器学习博士生Aran Komatsuzaki在M1发布后表示,M1是目前开源模型中拥有460亿活跃参数、接近最先进推理能力和代理能力的大语言模型,机器学习爱好者Vaibhav (VB) Srivastav也提到,在上下文长度上M1完全击败了DeepSeek R1和Qwen 235B。

MiniMax-M1发布后引起海外科技圈热议。

除了新模型MiniMax-M1以外,此次发布周MiniMax抛出的另一张王牌是新视频生成模型 Hailuo 02。在视频领域,MiniMax一直有着一定的统治力,早在2024年8月MiniMax就推出了海螺AI旗下的文本转视频模型Video-01,今年1月海螺AI推出最新自研S2V-01主体参考视频模型,解决了AI视频创作主体人物角色一致性的最大卡点。从2024年11月份到2025年3月,海螺视频/Hailuo AI的月访问量全球第一,力压Sora、Runway等海外外AI视频产品。

MiniMax称,此次最新发布的Hailuo 02在复杂指令遵循和复杂物理表现方面特别出色,既可以完整响应一些相当复杂的指令,又可以让仔细编写的prompt得到更好的反馈。根据生成的demo可以看到,在AI视频超难做好的如体操、杂技等考验主体动作丝滑度、连贯度的场景中,Hailuo 02也能完整、连贯体现,甚至连光影变化都能处理。在价格上,目前Hailuo 02价格也低于Runway、Sora等视频生成模型。

输入“画面中人物快速抛接球体,彩带飘动落下,人物不停抛接球体”后生成的视频。

DeepSeek之后基础大模型仍有创新空间

历经两年多的狂飙突进,大模型行业正在快速收拢。在海外,大模型决赛圈被收拢至OpenAI、谷歌、Meta、Anthropic和xAI五家公司,各家的发布也呈现你追我赶的态势。就在近期,谷歌刚带着Gemini 2.5 Pro刷新在数学、编程、推理基准测试中的SOTA力压OpenAI的o3、Claude 4等模型,一周后OpenAI快速推出o3-pro,并做到在智力水平上领先Gemini 2.5 pro。

在国内,随着DeepSeek的横空出世,竞争格局也发生了改变。其中,国产大模型六小虎中多家进行战略调整、放弃模型预训练,其中百川智能聚焦医疗、零一万物拥抱DeepSeek提供部署的专门定制解决方案并押注行业落地。

同时,互联网大厂也在发挥资源优势继续进击。根据相关证券报告,2025年字节跳动资本开支有望达到1600亿元,较去年的800亿翻了整整一倍;而阿里巴巴集团CEO吴泳铭则在今年2月的2025财年第三季度财报分析师电话会上宣布,未来三年,阿里将在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入,其中未来三年在云和AI的基础设施投入预计将超越过去十年的总和。

在国际和国内竞争加剧情况下MiniMax也成为了为数不多仍在坚持基础模型研发的企业。

成立三年多来,MiniMax一直勇当“第一个吃螃蟹的人”。2023 年下半年,当大部分国内大模型厂商还在继续迭代稠密dense模型之际,MiniMax率先投入大量资源研究MoE架构,并于2024年1月上线国内首个MoE大模型abab6,MoE架构后续彻底取代稠密架构成了大模型领域技术迭代的行业共识,这也是今年年初爆火出圈的DeepSeek使用的主要架构。

这一次,Minimax也以创新的方式试图改变DeepSeek-R1出现后形成的竞争格局。在此次发布的MiniMax-M1模型中,MiniMax继续创新地使用线性注意力Lightning Attention机制,同时也创造了一种名为CISPO(Clipped IS-weight Policy Optimization)的全新强化学习方法,更好地保留了长推理链条中的关键转折点,提高了学习效率与稳定性。技术报告显示,CISPO算法比包括字节近期提出的DAPO等强化学习算法收敛性能快了一倍,并显著的优于DeepSeek早期使用的GRPO。

知名数字经济学者、工信部信息通信经济专家委员会委员盘和林表示,在此次的新模型中,MiniMax的主要贡献还是在闪电注意力这一大模型算法改进上,之前其他大模型采用PPO/GRPO采用的“裁剪”方式有一些缺陷,MiniMax则通过CISPO对这些缺陷进行了一些优化,其目的还是为了降低训练成本和推理成本,这是进步,但这个进步如何转化为商业价值还需要在应用层面的具体实践。

盘和林还提到,现阶段的基础模型依然有很大的提升空间,这就是加码大模型的创业公司的机会。“很多用户并不喜欢用AI来干活,大模型一定还是有优化空间的,谁找对了大模型算法优化的方向,谁就是下一个科技巨头。deepseek向前走了一步,但还不够。”

备战下一个共识Agent时代

在产品发布周“打头阵”的MiniMax-M1技术报告中,MiniMax提到,“与最新的 DeepSeek-R1-0528 模型相比,MiniMax-M1在数学和编码竞赛中接近

DeepSeek R1-0528,而在更现实的工具使用和长上下文场景中实现了可比或更优的性能。值得注意的是,MiniMax-M1在代理工具使用基准TAU-Bench上优于Gemini 2.5 Pro,并在长上下文理解基准上超过了OpenAI o3 和Claude 4 Opus。通过有效的测试时间扩展,我们认为 MiniMax-M1 为下一代语言模型Agent解决现实世界挑战奠定了坚实的基础。”

各家模型在“人工分析智能指数”上的表现,MiniMax-M1作为开源模型表现优异。

看到这里不难能意识到,MiniMax已经准备好参与大模型的下一个风口Agent。今年随着Manus等智能体产品的爆火,Agent已经成为科技圈继大模型以后的第二个共识。更高效的推理和规划能力、更长的推理时间和更便宜的价格,都是Agent能顺利落地的重要因素。

除了准备好了一个更好的基底大模型来承接Agent爆发的需求,6月19日MiniMax也发布了一个能完成长程(Long Horizon)复杂任务的通用智能体,该智能体能多步规划出专家级解决方案、灵活拆解任务需求、执行多个子任务从而交付最终结果。据悉在MiniMax 内部,该产品已经被使用了两个月,逐渐成为内部超过50%的同学日常使用的产品。

MiniMax Agent主打的点是“靠谱”,在研发过程中按照“靠谱的人”的标准来设计和要求Agent,比如在编程能力上包含复杂跳转逻辑、能做全面测试从而不交付有bug的网页;在多模态方面除了支持长文本文件也支持视频、音频、图片等理解能力,也支持生成图文音并茂的作品;同时支持MCP扩展、开放并包。用户可以用它来完成做动画、广告片、简易ppt等任务。

今年4月底,MiniMax创始人、CEO闫俊杰在一次高层调研活动中汇报了MiniMax内部正在研发的智能体的技术创新点和应用场景,展示现场的白板上提到,未来智能体的模态内容从文本到多模态融合、智能体能执行任务的复杂度将从普通人半天工作量到专业人士一周工作量。

一个多月后,MiniMax Agent的正式发布,正是对这份规划的郑重“交卷”。从“解放大脑”到“解放手脚”,从聪明的“聊天伴侣”到“靠谱的生产力工具”,MiniMax Agent的发布,为AI行业的发展注入了一剂强心针。

可以看到,MiniMax新模型M1选择在进一步优化推理成本和Agent上发力,以创新方式调优结构、提高效率,叠加在视频模型上的优势,MiniMax再次搅动了大模型公司的格局。基础模型、Agent和视频模型也成为了MiniMax未来能否拿到AI时代一张船票的关键所在。

文/林文琪

图片由受访者提供

相关内容

热门资讯

宁波朗迪取得网布烫边切割装置专... 金融界2025年8月6日消息,国家知识产权局信息显示,宁波朗迪环境科技有限公司取得一项名为“网布烫边...
富兴塑膜取得PVC塑膜压纹成型... 金融界2025年8月6日消息,国家知识产权局信息显示,苍南县富兴塑膜有限公司取得一项名为“一种PVC...
美国拟2030年前在月球建成核... △艺术家描绘的月球上的电力系统。(图片来源:NASA) 当地时间8月5日,据多家美国媒体报道,美国交...
TTG3-1KSG,清清正反手... TTG3-1战胜KSG,终于结束了对KSG的连败。从EWC回来之后他们似乎变强了,清清证明了为什么萝...
中国电信视联网赋能基层治理 提... 近日,丰都县仁沙镇依托中国电信视联网技术,进一步提升基层治理智能化水平,推动乡村基层治理体系不断完善...
《上古OL》开发商被砍掉的《黑... 微软最近的大裁员砍掉了《上古卷轴OL》开发商备受期待的新IP(代号为黑鸟计划)以及Rare工作室的《...
山东科嘉电气:高效智能充电方案... 山东科嘉电气近日推出了两款创新充电设备,专为不同领域提供专业、高效、安全的充电解决方案。这些设备分别...
科技前沿丨普通家庭何时能用上保... 7月31日召开的国务院常务会议审议通过《关于深入实施“人工智能+”行动的意见》。会议指出,当前人工智...
泰科汽车取得油箱加油单向阀专利... 金融界2025年8月6日消息,国家知识产权局信息显示,芜湖泰科汽车科技有限公司取得一项名为“一种油箱...
当年吹爆Edge浏览器的我,现... 每位资深玩家,在对枪失败、团战暴毙后,都有一套神圣的仪式: “诶今天鼠标有点飘”、“这键盘键程不对”...
走出光伏同质化困境,BC生态圈... 来源:澎湃新闻 隆基绿能创始人、首席技术官李振国 同质化的红海厮杀,令光伏产业深陷恶性竞争泥潭。乘...
AL被打晕了?IG辅助抢大龙翻... ★游戏马蹄铁原创 AL对战IG第二局 IG无愧是现在LPL的人气王,流量王,他们的比赛不仅是明星选...
LOL:BLG被曝不是全华班,... Shadow护照是意大利的 在LPL赛区中,全华班自带流量和话题,像RNG、BLG这种主打全华班的...
紧盯AI人才,“鹅厂”招新,软... 8月6日,腾讯2026校园招聘正式启动。本次招聘面向2025年1月至2026年12月期间毕业的大学生...
DOTA2 7.39d 更新深... 当看到 7.39d 的更新日志时,我的第一反应是:这不是简单的数值微调,而是V社对当前版本生态的一次...
《仁王3》制作人访谈:保留硬核... 今年6月,《仁王3》发布了首支预告片,并宣布游戏将于明年年初正式发售,登陆PlayStation 5...
青春好市 | 以手抵心,对话千... 当棕榈叶在指尖翻飞成灵兽,当大漆在掌心打磨出光华,当破碎的古瓷片在你手中重获新生...这不是遥远的传...
IDC:Q2中国消费级游戏本市... IT之家 8 月 6 日消息,市场研究机构 IDC 今天发文,披露了中国消费级游戏 PC 市场的数据...
小米手机欧洲市场份额首超苹果,... 【太平洋科技快讯】8 月 6 日,小米集团合伙人、小米集团总裁、部总裁兼小米品牌总经理卢伟冰在社交媒...
王者荣耀:夏侯惇喜迎加强,亚连... 王者荣耀本赛季已经进入中期,还没有拿到王者印记的小伙伴确实该抓紧时间了,毕竟到了赛季后半段上分难度会...