面壁智能发布新一代端侧基座模型MiniCPM4.0
创始人
2025-06-10 02:41:41
0

上证报中国证券网讯(记者 孙小程)6月9日,记者自面壁智能获悉,该公司于近日发布新一代端侧基座模型MiniCPM4.0,让长文本、深思考在端侧真正跑起来。MiniCPM4.0拥有8B、0.5B两种参数规模,其中MiniCPM4-8B“闪电稀疏版”采用了新一代上下文稀疏高效架构。 针对单一架构难以兼顾长、短文本不同场景的技术难题,MiniCPM 4.0-8B采用“高效双频换挡”机制,能够根据任务特征自动切换注意力模式:在处理高难度的长文本、深度思考任务时,启用稀疏注意力以降低计算复杂度,在短文本场景下切换至稠密注意力以确保精度,实现了长、短文本切换的高效响应。 与此同时,MiniCPM4.0进一步实现了长文本缓存的大幅锐减,在速度、性能提升的同时,又做到了模型极致压缩,减小端侧算力层面的压力。 在应用上,基于8B版本,团队微调出两个特定能力模型,分别可以用做MCPClient和纯端侧性能比肩MiniCPM4-Surve。 面壁智能也携手诸多行业伙伴,持续推动MiniCPM4.0模型适配及应用拓展。截至目前,MiniCPM4.0已实现Intel、高通、MTK等芯片的适配。此外,MiniCPM4.0可在vLLM、SGLang、llama.cpp、LlamaFactory、XTuner等开源框架部署。同时面壁智能加强了对MCP的支持,进一步拓展了模型开发、应用潜力。 截至目前,面壁小钢炮MiniCPM系列全平台下载量累计破1000万。面壁智能相关负责人表示,未来面壁智能还将基于“大模型密度定律DensingLaw”,持续提高大模型的知识密度与智能水平,推动端侧智能高效发展与规模化产业应用。

上证报中国证券网讯(记者 孙小程)6月9日,记者自面壁智能获悉,该公司于近日发布新一代端侧基座模型MiniCPM4.0,让长文本、深思考在端侧真正跑起来。MiniCPM4.0拥有8B、0.5B两种参数规模,其中MiniCPM4-8B“闪电稀疏版”采用了新一代上下文稀疏高效架构。

针对单一架构难以兼顾长、短文本不同场景的技术难题,MiniCPM 4.0-8B采用“高效双频换挡”机制,能够根据任务特征自动切换注意力模式:在处理高难度的长文本、深度思考任务时,启用稀疏注意力以降低计算复杂度,在短文本场景下切换至稠密注意力以确保精度,实现了长、短文本切换的高效响应。

与此同时,MiniCPM4.0进一步实现了长文本缓存的大幅锐减,在速度、性能提升的同时,又做到了模型极致压缩,减小端侧算力层面的压力。

在应用上,基于8B版本,团队微调出两个特定能力模型,分别可以用做MCPClient和纯端侧性能比肩MiniCPM4-Surve。

面壁智能也携手诸多行业伙伴,持续推动MiniCPM4.0模型适配及应用拓展。截至目前,MiniCPM4.0已实现Intel、高通、MTK等芯片的适配。此外,MiniCPM4.0可在vLLM、SGLang、llama.cpp、LlamaFactory、XTuner等开源框架部署。同时面壁智能加强了对MCP的支持,进一步拓展了模型开发、应用潜力。

截至目前,面壁小钢炮MiniCPM系列全平台下载量累计破1000万。面壁智能相关负责人表示,未来面壁智能还将基于“大模型密度定律DensingLaw”,持续提高大模型的知识密度与智能水平,推动端侧智能高效发展与规模化产业应用。

相关内容

热门资讯

原创 一... 小米手机在很多人的印象中,都是高性价比机型,但是小米旗下的高端旗舰,性价比却并不高,例如小米15系列...
科大讯飞半年亏损2.39亿,拟... 文/杨剑勇 自2022年底OpenAI推出ChatGPT后,将人工智能发展推向一个新高度,尤其Dee...
传谷歌AI眼镜将由HTC代工 编译/VR陀螺 随着 HTC 近日发布其首款 AI 眼镜 Vive Eagle,重新点燃了市场对 A...
vampir吸血鬼手游一键获取... 《Vampir》是网石旗下一款哥特暗黑风 MMORPG 手游,将玩家带入中世纪吸血鬼与人类的战争漩涡...
卡普空TGS2025豪华阵容公... 卡普空已正式开通2025年东京电玩展特设网站,并通过公告公布了本届展会的游戏阵容与活动日程。本届东京...
影响力投资是改变世界的金融力量 人类肆无忌惮地向地球索取资源,大量排放温室气体、污水和各类废弃物,却从未意识到地球正在接近承载能力的...
从百万预算到几分钟成片:百度蒸... 在品牌营销的世界里,视频一直是最贵又最折腾的内容拼图。 拍一条像样的TVC广告,可能要烧掉上百万元;...
问题更大了?这次“星舰”没飞起... 上观新闻消息,美国太空探索技术公司(SpaceX)原定于当地时间8月24日晚在得克萨斯州进行新一代重...
首个运用 AI 技术的适老电视... IT之家 8 月 25 日消息,中国视像行业协会上周发布了《适老化电视人工智能技术要求》,该标准由海...
海南:Ⅰ级响应!非必要不出门! 海南省防灾减灾救灾委员会 关于将防汛防风Ⅱ级应急响应提升至 Ⅰ级应急响应的通知 ↓ 各市、县、自治县...
要来了?曝《极限竞速:地平线6... 微软已确认《极限竞速》系列新作将在明年推出。由于《极限竞速:Motorsport》近期刚刚发售,因此...
《明末》夏思源谈游戏开发:做前... 近日,凤凰网财经发布了对《明末:渊虚之羽》制作团队灵泽科技进行采访的视频。 在采访中,灵泽科技联...
因为合作玩法《使命召唤:黑色行... 自《使命召唤》系列战役模式诞生以来,玩家就一直可以选择最适合自己的难度——无论是新兵、普通、老兵还是...
三年磨一剑,企业微信5.0如何... 继2022年1月企业微信4.0版本发布之后,企业微信于上周做了3年多来的首次重大版本更新——企业微信...
做医疗健康领域的创新尖兵 通过无创脑机接口帽采集患者大脑信息,再借助强大算力进行计算分析,构建脑功能状态、神经肌肉控制和运动意...
微软新技术!ROG Xbox ... 微软宣布将于10月16日发售便携式游戏掌机“ROG Xbox Ally”及“ROG Xbox All...
《牧场物语 来吧!风之繁华集市... 在整个《牧场物语》系列中,如果说《矿石镇的伙伴们》是名声最响、受众最广的一代经典,那么《风之集市》则...
PDM系统与邮件系统、即时通讯... 在当今这个信息爆炸、追求效率的时代,我们每天都在各种软件之间来回切换,试图跟上工作的节奏。想象一下这...
智能制造背景下,我国机器人教育... 8月8日~12日,2025世界机器人大会(WRC)在北京亦庄北人亦创国际会展中心圆满举行,近百万名观...