黄仁勋为何与这家国产AI模型创始人单独会面两个小时?
创始人
2025-07-21 12:22:07
0

7月18日,英伟达(NVIDIA)创始人兼首席执行官黄仁勋在单独会见了中国大模型初创公司MiniMax(希宇科技)创始人闫俊杰,双方进行了两个小时的深入交流,分享了对中美AI行业当下与未来的看法。有消息称,闫俊杰也是唯一单独会见黄仁勋的中国AI创业公司创始人。

据了解,MiniMax 由前商汤科技副总裁、研究院副院长兼智慧城市事业群 CTO闫俊杰在2021 年创立。

今年6月17日,MiniMax宣布推出了全球首个开源的大规模混合架构的推理模型M1,不仅性能超过国内的闭源模型,接近最新版的DeepSeek R1以及海外的最领先模型,同时还拥有更为出色的效率和业内最高的性价比。

在阿里巴巴集团、腾讯和 IDG 资本的支持下,MiniMax 声称其 Lightning Attention 机制是一种计算注意力矩阵的方法,可以提高训练和推理效率,使其 M1 模型在计算长上下文输入和尝试推理时具有优势。

因此,M1显著的优势是支持目前业内最高的100万上下文的输入,跟闭源模型里面的 Google Gemini 2.5 Pro 一样,是 DeepSeek R1 的 8 倍,以及业内最长的8万Token的推理输出。

MiniMax表示,这主要得益于其独创的以闪电注意力机制为主的混合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。例如,在用8万Token深度推理的时候,只需要使用DeepSeek R1约30%的算力。这个特性使得MiniMax M1在训练和推理的时候都有很大的算力效率优势。

除此之外,MiniMax提出了更快的强化学习算法CISPO,通过裁剪重要性采样权重(而非传统token更新)提升强化学习效率。在AIME 的实验中,MiniMax发现这比包括字节近期提出的 DAPO 等强化学习算法收敛性能快了一倍,显著的优于 DeepSeek 早期使用的 GRPO。

得益于上述两个技术创新,MiniMax最终强化训练过程非常高效,超出预期。实际上整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美金。这比一开始的预期少了一个数量级。

MiniMax在业内主流的 17 个评测集上详细评测了M1,结果显示M1在长上下文理解任务中表现卓越,仅以微弱差距落后于Gemini 2.5 Pro,但在在代理工具使用场景(TAU-bench)中战胜了Gemini 2.5 Pro。具体的结果如下:

因为相对高效的训练和推理算力使用,MiniMax宣布在 MiniMax APP 和 Web 上都保持不限量免费使用。

同时,还将以业内最低的价格在官网提供API:在0-32k的输入长度的时候,输入0.8元/百万token, 输出8元/百万token;在32k-128k的输入长度的时候,输入1.2元/百万token, 输出16元/百万token;在最长的 128k-1M 的输入长度的时候,输入2.4元/百万token, 输出24元/百万token。

前面两种模式都比 DeepSeek-R1 性价比更高,后面一种模式 DeepSeek 模型不支持。

编辑:芯智讯-浪客剑

相关内容

热门资讯

桂林鸿程取得外置卧式多头分级机... 国家知识产权局信息显示,桂林鸿程矿山设备制造有限责任公司取得一项名为“一种外置卧式多头分级机”的专利...
真的建议你睡前关掉WiFi,不... 它几乎存在于每个家庭 还常年不断电 没有它你可能还会焦虑 它,就是WiFi路由器 据中国新闻网报道 ...
小米17:旗舰机市场销量领跑,... 在2025年的旗舰机市场,小米17系列以破竹之势席卷而来,不仅销量数据屡创新高,更以“技术普惠”的理...
昆明文理学院举办“AI赋能语言... 近日,“AI赋能语言教学与国际传播”研讨会暨云南教育国际交流协会民办高校专家委员会第三次会议在昆明文...
建霖健康取得易于更换滤芯的装置... 国家知识产权局信息显示,厦门建霖健康家居股份有限公司取得一项名为“一种易于更换滤芯的装置”的专利,授...
有色金属行业积极推动人工智能大... 从过去采矿凭经验到如今实现智慧勘探,从昔日冶炼靠手艺到如今实现AI精准调控,从以往粗放加工到如今大数...
原创 越... 越南开国功臣武元甲晚年说:若非黎笋固执,中越根本不用打那一仗。这话一出来,不知道戳中了多少经历过那段...
申彦通讯取得丝印定位工装专利,... 国家知识产权局信息显示,上海申彦通讯设备制造有限公司取得一项名为“一种丝印定位工装”的专利,授权公告...
浦东具身智能企业跻身全球第一梯... 来源:市场资讯 (来源:上观新闻) 12月26日,浦东具身智能企业——艾利特机器人发布全新复合机器人...
俄罗斯团体评年度热词 “拉布布... 新华社莫斯科12月28日电(记者栾海)临近岁末,俄罗斯多家团体评选出本国2025年度热词,“胜利”、...
我不是被运营商收买了,我就是运... 最近网络之争,引来很多水军的攻击,其中我就看到一种说法,项立刚是被三大电信运营商收买了,为电信运营商...
梁定邦:人工智能年增速约30%... 来源:金融一线 12月28日金融一线消息,中国财富管理50人论坛2025年会在京召开,本届年会的主题...
红桥区6个行业高质量数据集全部... 近日,天津市2025年行业高质量数据集名单发布,红桥区数据局组织推荐的6个数据集均成功入选,覆盖工业...
我国交付国际热核聚变实验堆IT... 新华社合肥12月28日电(记者戴威、何曦悦)28日,由中国科学院合肥物质科学研究院等离子体物理研究所...
互联网运营优化三大模式:百度、... 互联网运营, 百度是基于权重和成本模型, 抖音头条则单内容作战×千人千面的神经模型, ...
郑州师范学院第二附属小学第二届... 大象新闻记者 李书恒 通讯员 李琪/文图 冬日暖阳映校园,科技之光耀童心。12月26日,郑州师范学院...
泽恩五金取得空芯插针端子专利,... 国家知识产权局信息显示,东莞市泽恩五金制品有限公司取得一项名为“一种空芯插针端子”的专利,授权公告号...
人形机器人产业,大利好! 12月26日,工业和信息化部人形机器人与具身智能标准化技术委员会(以下简称“标委会”)成立大会在京举...
筑牢伦理根基 让人工智能翻译传... (来源:中国改革报) 转自:中国改革报 □ 易曼 每一门语言都是人们在特定地域、经过漫长的历史和生活...
美林美育大课堂走进社区 | 萌... 当传统生肖文化邂逅指尖创意,当专业艺术资源走入寻常邻里,会碰撞出怎样的温暖火花?近日,北京韩美林艺术...