黄仁勋为何与这家国产AI模型创始人单独会面两个小时?
创始人
2025-07-21 12:22:07
0

7月18日,英伟达(NVIDIA)创始人兼首席执行官黄仁勋在单独会见了中国大模型初创公司MiniMax(希宇科技)创始人闫俊杰,双方进行了两个小时的深入交流,分享了对中美AI行业当下与未来的看法。有消息称,闫俊杰也是唯一单独会见黄仁勋的中国AI创业公司创始人。

据了解,MiniMax 由前商汤科技副总裁、研究院副院长兼智慧城市事业群 CTO闫俊杰在2021 年创立。

今年6月17日,MiniMax宣布推出了全球首个开源的大规模混合架构的推理模型M1,不仅性能超过国内的闭源模型,接近最新版的DeepSeek R1以及海外的最领先模型,同时还拥有更为出色的效率和业内最高的性价比。

在阿里巴巴集团、腾讯和 IDG 资本的支持下,MiniMax 声称其 Lightning Attention 机制是一种计算注意力矩阵的方法,可以提高训练和推理效率,使其 M1 模型在计算长上下文输入和尝试推理时具有优势。

因此,M1显著的优势是支持目前业内最高的100万上下文的输入,跟闭源模型里面的 Google Gemini 2.5 Pro 一样,是 DeepSeek R1 的 8 倍,以及业内最长的8万Token的推理输出。

MiniMax表示,这主要得益于其独创的以闪电注意力机制为主的混合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。例如,在用8万Token深度推理的时候,只需要使用DeepSeek R1约30%的算力。这个特性使得MiniMax M1在训练和推理的时候都有很大的算力效率优势。

除此之外,MiniMax提出了更快的强化学习算法CISPO,通过裁剪重要性采样权重(而非传统token更新)提升强化学习效率。在AIME 的实验中,MiniMax发现这比包括字节近期提出的 DAPO 等强化学习算法收敛性能快了一倍,显著的优于 DeepSeek 早期使用的 GRPO。

得益于上述两个技术创新,MiniMax最终强化训练过程非常高效,超出预期。实际上整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美金。这比一开始的预期少了一个数量级。

MiniMax在业内主流的 17 个评测集上详细评测了M1,结果显示M1在长上下文理解任务中表现卓越,仅以微弱差距落后于Gemini 2.5 Pro,但在在代理工具使用场景(TAU-bench)中战胜了Gemini 2.5 Pro。具体的结果如下:

因为相对高效的训练和推理算力使用,MiniMax宣布在 MiniMax APP 和 Web 上都保持不限量免费使用。

同时,还将以业内最低的价格在官网提供API:在0-32k的输入长度的时候,输入0.8元/百万token, 输出8元/百万token;在32k-128k的输入长度的时候,输入1.2元/百万token, 输出16元/百万token;在最长的 128k-1M 的输入长度的时候,输入2.4元/百万token, 输出24元/百万token。

前面两种模式都比 DeepSeek-R1 性价比更高,后面一种模式 DeepSeek 模型不支持。

编辑:芯智讯-浪客剑

相关内容

热门资讯

育碧认可《刺客信条:影》表现:... 《刺客信条:影》肩负重任,其必须取得成功才能帮助育碧摆脱危机。然而该作虽反响不错,但并未取得任何显著...
从数据到效率:云计算如何为制造... 时代在变更,科技在发展,而云计算正在不断被应用于各个行业的发展。此时此刻的云计算好像正在重塑着制造业...
众擎机器人连续完成Pre-A+... 来源:猎云网 近日,通用型人形机器人研发商众擎机器人(下称:众擎)完成两轮融资。其中,Pre-A++...
链博会盘点之一:哪些展台人气最... 7月16日-20日,第三届中国国际供应链促进博览会在北京举办。“六链一展区”于19日和20日免费向公...
中国队在世界杯夺冠了!是…… 被称为“机器人足球世界杯”的RoboCup正在巴西萨尔瓦多举办。 本届比赛采用“AI赛”,即机器人根...
这个盛夏来广州开打!DNF手游... 7月25至26日,在广东省新闻出版局、广州市文化广电旅游局指导支持下,DNF手游满级扩张充能营地快闪...
城市文脉的赓续与城市文明的构建 城市文脉的赓续与城市文明的构建 谢有顺 中山大学中文系教授,广东省作家协会主席 距今5000年前后,...
江华县新华书店开展“蒲公英悦读... 红网时刻新闻7月21日讯(通讯员 胡菲菲)假期,是孩子探索世界的黄金期,也是家长满心期待的成长契机。...
宇树IPO、智元“借壳”,机器... 机器人大浪来袭! 此前不久,智元机器人拟通过公司及核心团队共同出资设立的持股平台,以协议转让和要约收...
19年的等待!中国战队天禄拿下... 7月21日凌晨,中国战队TYLOO天禄在塞尔维亚贝尔格莱德举行的FISSUREPlayground1...
华为擎云以“全链路健康管理”破... 【环球网科技报道 记者 张阳】7月18日至20日,2025(19th) 中国卫生信息技术/健康医疗大...
中国测绘科技登上珠峰 背后是国... 华测导航自主研制的P5北斗高精度GNSS接收机(左下)在珠峰峰顶完成测量任务。本文均为 受访者 供图...
风靡的“血色海龟汤”与小学生们... “一个马戏团里有两个侏儒,可是这天早上有一个侏儒在家自杀了,现场还有一地木屑,你猜为什么?” “他俩...
链博会观察|科创背后的金融力量... 在今年的链博会上,高新技术、AI机器人随处可见。如比人手更加灵活的机械手、小型飞机上的电池产品……而...
Netflix宣布加大游戏投资... 在关闭由《光环》资深制作人的3A工作室后,流媒体巨头Netflix(网飞)在最新财报会议中确认将提升...
7月22日至23日凌晨 金星伴... 7月22日至23日凌晨,金星和木星将先后与一弯残月近距离相伴,届时只要天气晴好,感兴趣的公众用肉眼即...
新动力电子取得自动上料的超声波... 金融界2025年7月21日消息,国家知识产权局信息显示,东莞新动力电子有限公司取得一项名为“自动上料...
AL鏖战五局惜败GEN,获电竞... 北京时间7月21日凌晨,在沙特利雅得举行的2025电竞世界杯英雄联盟项目决赛中,LPL(中国大陆赛区...